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[...] 

But. all remembered beauty is no more 
Than a vague prelude to the thought of you 

[■■■] 

Sara Teasdale. Love songs. 




Introducción 


Acerca de este libro 

A principio de marzo de 2006, tuvieron lugar en Girona las I Jornadas sobre 
Sistemas de Información Geográfica (SIG) libres, organizadas por la Universitat de 
Girona y el Servei de Sistemes d’Informació Geográfica i Teledetecció (SIGTE). Al 
amparo de ese encuentro, algunos (no muchos) decidimos aprovechar el momento 
para, entre otras cosas, reunirnos y fundar el capítulo hispano-hablante de OSGeo, 
una organización internacional cuya actividad se centra en torno a los Sistemas 
de Información Geográfica libres 1 . El objetivo era intentar formar un grupo de 
trabajo para afrontar aquellas cuestiones de interés general para la comunidad SIG 
de habla hispana 2 , y fueron muchas las tareas que en aquel momento se recopilaron 
como necesarias dentro del ámbito de los SIG en lengua española. Entre ellas, la 
creación de un libro libre sobre Sistemas de Información Geográfica. 

Este libro es mi intento particular de tratar de dar solución a esa necesidad en 
ese momento apuntada, y recopila un trabajo realizado pacientemente desde enton- 
ces, siendo un testigo de todo el esfuerzo y desarrollo que tiene lugar en nuestros 
días en materia de SIG. Con él, espero que dicho desarrollo no solo continúe, sino 
que crezca, poniendo a disposición de la comunidad los conocimientos con los que 
establecer una base conceptual más sólida, así como una herramienta de máxima 
utilidad para la formación y transmisión de los aspectos teóricos relacionados con 
los Sistemas de Información Geográfica. 


¿Por qué escribir este libro? 

Como ya quedó claro en aquella reunión fundacional del capítulo hispano- 
hablante de OSGeo, un libro como este era algo necesario dentro del mundo de 
los SIG, y lo sigue siendo hoy a pesar del tiempo que ha pasado desde entonces. 

Es difícil encontrar hoy en día una disciplina científica que no pueda sacar 
partido de los Sistemas de Información Geográfica y no contemple a estos como 
herramientas de primera línea. Incluso fuera del ámbito científico, los SIG son 

x Si quieres saber más, puedes visitar su Web en http : //www . osgeo . org, donde encontrarás, 
entre otras muchas cosas, este mismo libro. 

2 Un resumen breve de las labores del capítulo hispano-hablante y su creación apareció en 
el número 2 de la revista oficial de OSGeo, a la que puedes acceder libremente en la dirección 
Web http : //www . osgeo . org/ Journal 


parte de nuestra vida diaria, y la mayoría de la gente ha usado en algún momento 
un callejero en Internet o un navegador GPS, elementos que forman parte del 
conjunto de tecnologías directamente relacionadas con los SIG y su entorno. 

En una situación así, cabe esperar que el sector editorial se encuentre en un 
estado de similar desarrollo, y el número de obras disponibles sea no solo abundante, 
sino diverso, y que cubra con detalle tanto los fundamentos básicos de la disciplina 
como los desarrollos más recientes (que no son pocos). Esto, sin embargo, no sucede 
realmente así. Si hablamos del mercado editorial en español, las referencias de 
que disponemos no están en absoluto acordes con el buen estado del ámbito de 
los SIG, tanto en su desarrollo e implementación como en el volumen de negocio 
que generan en los países de habla hispana. 

Los principales textos de SIG en nuestro idioma fueron escritos en los años 90, 
cuando comenzó a asentarse el sector de los Sistemas de Información Geográfica, 
especialmente en España, ocupando un nicho entonces desierto dentro del mer- 
cado editorial. Lamentablemente, ninguno de estos trabajos ha sido actualizado 
recientemente, a pesar de que los cambios que se han producido en el sector han 
sido tan notables que dicha actualización resulta completamente imprescindible. 

A partir del año 2000, el ritmo editorial en el ámbito del SIG no decae, pero las 
referencias nuevas que hacen su aparición en el mercado son casi en su totalidad 
de corte práctico, bien sea referidas a un software en concreto, o bien a un cam- 
po de aplicación particular. Los fundamentos básicos, necesarios para cualquier 
operación con un SIG, quedan en estos casos explicados en base a un programa 
concreto, o bien se supone su conocimiento a través de otros textos. 

En resumen, es un buen momento para escribir un libro sobre SIG en español, 
y es así porque resulta necesario recoger los conocimientos actuales en este campo, 
de la misma forma que se recogieron en una etapa anterior en algunos de esos 
textos comentados. 

Pero la razón para escribir este libro no es únicamente que este sea un buen 
momento para escribir un libro de SIG. Porque este no es solo un libro de SIG, 
sino un libro libre sobre SIG. Y si este resulta un momento ideal para escribir un 
libro sobre SIG en nuestro idioma, lo es más aún si este libro es libre, tal y como 
el que ahora mismo estás leyendo. 

El software libre ha experimentado en los últimos años un crecimiento im- 
pensable tiempo atrás. En la mayoría de áreas existen ya alternativas libres al 
software privativo, suficientemente maduras como para dar respuesta a todas las 
necesidades de los usuarios. Lejos de aquella imagen de aplicaciones muy alejadas 
de las necesidades y conocimientos del usuario medio, las aplicaciones libres están 
cada día más presentes en todos los ámbitos y a cualquier nivel de utilización, 
siendo su penetración muy elevada y, más importante aún, creciente. Los SIG, por 
supuesto, no son ajenos al movimiento del software libre, y disponemos a día de 
hoy de excelentes alternativas en nuestro campo. 

Todas estas aplicaciones SIG libres suelen venir acompañadas de sus corres- 



pondientes textos de ayuda, habitualmente también libres, los cuales constituyen 
además muy buenas referencias sobre el campo de los SIG en general. Existen 
incluso obras no libres de gran relevancia 3 , con gran cantidad de información 
y actualizadas periódicamente en nuevas ediciones. Se puede, en resumen, leer 
mucho sobre SIG libres. 

Sin embargo, todos estos textos libres se hallan siempre supeditados a algún 
software (libre casi siempre), y no existe ningún tratado completo sobre SIG que 
no se base en una aplicación concreta para desarrollar sus contenidos. En el mundo 
libre, el esfuerzo editorial va siempre de la mano del software. Y esto es así no solo 
en nuestro idioma, sino en todos los demás. Sorprendentemente, no hay ninguna 
obra libre que trate los SIG de forma genérica y pretenda dar una formación 
conceptual al respecto. Todos los textos libres sobre SIG son, en la actualidad, de 
tipo práctico en mayor o menor medida. 

Así pues, es un buen momento para escribir un libro en español sobre SIG, y es 
un excelente momento para hacer un libro libre sobre SIG, con independencia del 
idioma, pues ambos son elementos necesarios. Es seguro que hay muchos lectores 
potenciales que quieren aprender sobre SIG, y este libro es la forma de poner a 
su alcance los conocimientos actuales de los que disponemos, con una obra actual 
y accesible. Esa es la razón por la que se ha escrito el libro que ahora tienes en 
tus manos (o en la pantalla de tu ordenador o en cualquier otro soporte en el que, 
gracias a la libertad con la que se distribuye, puede haber llegado hasta ti). 


A quién va dirigido este libro 

Es importante reseñar que este es un libro principalmente teórico. Está enfoca- 
do a todos aquellos que deseen aprender los fundamentos teóricos de la disciplina 
de los SIG, abarcando la practica totalidad de ramas de esta. Estas ramas toman 
elementos de muchas otras disciplinas distintas (la informática, la geografía, la ma- 
temática...), y todas ellas se han tratado a su vez con un suficiente nivel de detalle. 
Un lector que asimile la mayor parte de los conocimientos de este libro estará en 
una situación excepcional para comprender en conjunto todo lo que representan los 
SIG, qué tareas pueden hacerse con ellos, y entender por qué, cómo y cuándo se han 
de llevar a cabo dichas tareas. El objetivo es formar a alguien en materia de SIG, de 
tal modo que pueda posteriormente afrontar tareas relacionadas, tales como la rea- 
lización de proyectos con Sistemas de Información Geográfica, o la aplicación de los 
SIG a un área concreta de trabajo, cualesquiera que sean las características de esta. 

Aunque se trate de un libro teórico, este libro puede (y debe) convertirte en un 
buen usuario de SIG y ayudarte en el terreno práctico de su utilización. Tanto si 
eres ya usuario de SIG como si no lo eres, es probable que la lectura de estas páginas 

3 Por ejemplo Neteler, M. & Mitasova, H. Open Source GIS: A GRASS GIS Approach, Springer, 
New York, 2007. 


te aporte gran cantidad de información que mejorará la forma en que utilizas (o 
utilizarás) un Sistema de Información Geográfica, pues te ayudará a entenderlo 
mejor. No obstante, si lo que pretendes es aprender a utilizar un SIG y buscas un 
manual para ello, este no es, en principio, el libro que andabas buscando, ya que no 
se dan indicaciones sobre cómo usar un SIG en concreto o cómo realizar procesos y 
operaciones con él. Podrías leer completo este libro y después no saber qué hacer ante 
una aplicación SIG, porque no vas a encontrar aquí cómo utilizar ninguna de ellas. 

En ese caso, y sí deseas aprender a manejar un programa concreto pero no tienes 
experiencia previa en este campo, este libro será de todas formas una herramienta 
muy útil. Puedes complementar el contenido de estas páginas con el manual de 
usuario del SIG que elijas, e ir aprendiendo a utilizar este a medida que construyes 
una base sólida de conocimientos sobre la que apoyar dicho aprendizaje. 

En resumen, este es un libro orientado a quienes desean aprender con mayor o 
menor profundidad qué es y para que sirve un SIG, aportándoles la base necesaria 
para que posteriormente puedan afrontar su trabajo con un SIG, tanto si ya tienen 
nociones al respecto como si todavía no han utilizado uno antes. 

Si al leer este libro echas en falta algo que consideras importante, házmelo 
saber en volayaf @gmail . com. 
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Capítulo 1 


Introducción. ¿Qué es un SIG? 


Este capítulo presenta los conceptos fundamentales sobre Sistemas de Información 
Geográfica (SIG), definiéndolos y presentando tanto sus capacidades fundamentales como 
la forma en que estas pueden ser aprovechadas. Asimismo, se presentan los SIG como 
sistemas complejos, y se describe cada uno de sus componentes principales. El capítulo 
presenta una visión global del ámbito de los SIG y de la ciencia asociada a los SIG co- 
mo disciplina independiente, al tiempo que muestra el contexto en el que el desarrollo y 
utilización de estos se produce en la actualidad. 


1.1. Introducción 

Para justificar la importancia de los Sistemas de Información Geográfica (SIG) 
y el papel que estos juegan hoy en día, es habitual en libros como este citar el hecho 
de que aproximadamente un 70% de la información que manejamos en cualquier 
tipo de disciplina está georreferenciada. Es decir, que se trata de información a 
la cual puede asignarse una posición geográfica, y es por tanto información que 
viene acompañada de otra información adicional relativa a su localización. 

Si bien es probable que este porcentaje no haya variado desde que comenzó a 
mencionarse en los libros sobre SIG, la situación es en la actualidad más favorable 
que nunca para el desarrollo de herramientas que permitan la utilización de toda 
esa información al tiempo que se consideran los datos relativos a su posición en el 
espacio. Esto es así no solo porque trabajamos con gran cantidad de información 
referenciada geográficamente, sino porque somos cada día más conscientes de 
la importancia que esa componente geográfica tiene. La geografía ha pasado de 
ser un ámbito particular con cierta relación con otros campos a ser un elemento 
fundamental incorporado a la mayor parte de las disciplinas. Y no solo en el terreno 
científico, sino en el terreno mismo de la vida diaria, donde toda esta información 
desempeña un papel de gran importancia. 

La utilización de cartografía ha dado un vuelco radical en el plazo de unas 
décadas, permitiendo nuevas posibilidades y acercando la información cartográfica 
como herramienta de primer orden a un público amplio y diverso. La elaboración 
misma de cartografía ha pasado de ser terreno exclusivo de profesionales del sector 
a ser una labor abierta donde las nuevas tecnologías, especialmente las de corte 
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colaborativo, han permitido que otro tipo de usuarios desarrollen y compartan 
información cartográfica. 

En este sentido, los SIG no son solo herramientas dentro de ese contexto de 
gran importancia de la información geográfica, sino en gran medida responsables 
de que esa situación sea tal, pues su contribución dentro del panorama relativo 
a la geografía ha sido vital para impulsar esta y hacerla llegar hasta su lugar 
actual. En una sociedad donde la información y la tecnología son dos de los pilares 
fundamentales, los SIG son, sin lugar a dudas, la tecnología estandarte para el 
manejo de información geográfica, y los elementos básicos que canalizan la gestión 
de todo aquello que, de un modo u otro, presente una componente geográfica 
susceptible de ser aprovechada. 

Así, un SIG es fundamentalmente una herramienta para trabajar con infor- 
mación georreferenciada, una definición en la que pueden entrar un gran número 
de tecnologías y de otros elementos no tecnológicos, los cuales veremos a lo largo 
de este libro. 


1.2. Un pequeño ejemplo 

Para comenzar a tener una idea correcta de lo que representa e implica un SIG, 
veamos un sencillo ejemplo. Supongamos el caso de un organismo o empresa cuyo 
trabajo incluye la gestión de una masa forestal. Este trabajo de gestión implicará 
algunas actividades como las siguientes, en las cuales se utiliza en mayor o menor 
medida información georreferenciada. 

■ Delimitación de las distintas zonas inventariables y unidades dasocráticas 
(montes, cantones, rodales, etc.) 

■ Diseño de inventarios 

■ Realización de inventarios y gestión de sus datos para la obtención de 
resultados tales como estimaciones de volúmenes maderables. 

■ Gestión de infraestructuras del monte tales como vías de comunicación, 
torres de vigilancia contra incendios, etc. 

En un contexto en el que no existen medios informáticos para la realización de 
estas tareas, gran parte de ellas se desarrollarán con el apoyo de cartografía clásica. 
Así, las zonas inventariables se delimitarán sobre un plano, y sobre este mismo 
pueden medirse sus superficies con la ayuda de un planímetro. En ese mismo plano 
se localizan las parcelas a muestrear en un inventario, y los operarios encargados 
de llegar hasta esas parcelas y realizar las mediciones pertinentes se ayudan de 
él para localizarlas y desplazarse sobre el terreno. 

Los resultados del inventario se almacenan en estadillos, y las operaciones 
correspondientes al análisis estadístico de estos se realizan de forma manual, así 
como la comparación con inventarios anteriores que permiten estudiar la evolución 
del monte. 



Introducción. ¿Qué es un SIG? 


5 


La presencia de medios informáticos facilita estas tareas, mejorando por una 
parte la gestión de los datos, y por otra las operaciones que pueden realizarse sobre 
estos. Una sencilla hoja de cálculo, por ejemplo, es una herramienta imprescindible 
para la gestión de los datos de un inventario, haciendo que todo el trabajo con 
ellos resulte más eficiente y adecuado. 

En lo relativo a la cartografía, la situación, aunque con un desarrollo (y espe- 
cialmente una implantación de usuarios) más reciente, no es muy distinta. Ventajas 
similares a las que aporta una hoja de cálculo pueden encontrarse en una aplicación 
que permitiera utilizar mapas y planos dentro de un ordenador, con la consecuente 
ganancia en productividad, eficiencia y precisión. Esta aplicación destinada al ma- 
nejo de cartografía es el concepto básico de un Sistema de Información Geográfica, 
y la idea fundamental a partir de la cual comenzó el desarrollo de estos. 

Con un SIG, la cartografía de esa masa forestal puede visualizarse y almacenarse 
en un ordenador personal, y pueden realizarse sin dificultad y de forma instantánea 
cálculos tales como mediciones de cada una de las entidades. La creación de nueva 
información cartográfica se lleva a cabo ya en el propio SIG, del mismo modo que la 
edición de cartografía ya existente. Modificar el límite de una unidad dasocrática o el 
trazado de una vía, o crear la cartografía correspondiente a las parcelas de inventario 
son tareas que, en nuestro caso de ejemplo, se realizan hoy en día empleando un SIG. 

Las ventajas que esto tiene son muchas, especialmente las relacionadas con 
una mejor gestión del conjunto de distintos datos que se manejan, así como las 
relativas a la sencillez con que pueden modificarse estos datos 1 . 

Otras de las labores donde un SIG demuestra su utilidad es en el análisis. Los 
datos geográficos pueden ser objeto de gran número de distintos análisis, y la 
capacidad de cómputo de un ordenador es necesaria para muchos de ellos. La 
herramienta idónea para implementar esos algoritmos y operaciones de análisis 
espacial es el SIG, pues ya contiene los elementos necesarios para el manejo de los 
datos de partida, es decir, aquellos que contienen la información georrefer enciada. 

Y, por supuesto, un SIG conectado a un periférico de impresión permite generar 
una versión analógica a partir de la información con la que se trabaja, teniendo 
la capacidad de crear cartografía en papel cuando así se requiera. 

En otras palabras, un SIG es una herramienta que brinda a las labores de uso y 
manejo de información geográfica toda la potencia de un ordenador, pues ha sido 
diseñada específicamente para trabajar con este tipo particular de información. 

No obstante, más allá de todas estas tareas antes mencionadas el concepto de 
SIG ha evolucionado hasta convertir actualmente a estos en sistemas complejos 
que buscan dar solución a todas las necesidades que se presentan en situaciones 
similares a la del ejemplo comentado. Con la tecnología actual, la incorporación 
de elementos propios de los SIG puede llegar mucho más allá, y uno de los pilares 

1 Veremos con más detalle las ventajas de los datos digitales frente a los datos analógicos en 
el capítulo 6 
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más sólidos de los SIG en la actualidad es su capacidad de mostrar que existe una 
componente espacial susceptible de ser gestionada con la ayuda de un SIG en la 
práctica totalidad de contextos posibles. 

Como sistema, un SIG puede gestionar la cartografía necesaria para la gestión 
integral del monte, y hacerlo además de forma centralizada. De este modo, se 
garantiza el rigor y la robustez de los datos base, ya que el SIG es el encargado de 
canalizar la utilización de estos por parte de todos los usuarios. Esto es de especial 
importancia en caso de que se editen los datos, ya que esta edición también está 
centralizada, y un usuario ve reflejarse en su cartografía de forma inmediata los 
cambios realizados por otro, teniendo siempre a su disposición la versión más 
actual y, por tanto, más adecuada. 

A esto puede añadirse la utilización de SIG móviles en dispositivos portátiles, 
que permiten que el SIG se incorpore también a las fases de trabajo de campo. Esa 
misma cartografía centralizada pueden utilizarla los operarios en campo a través 
de sus dispositivos para desarrollar su trabajo, ayudándose además de sistemas 
de navegación para la localización de las parcelas de un muestreo o de cualquier 
otro punto de interés al que deban desplazarse. 

Gracias a la tecnología SIG, la información espacial puede ser aprovechada en 
mayor medida, y en muchos casos pasa de ser una información inherente a los datos 
pero sin una verdadera aplicación, a ser un elemento sumamente enriquecedor y 
clave para muchos análisis. 

En nuestro ejemplo de gestión forestal, los propios datos del inventario, que 
antes eran fundamentalmente datos sobre las propiedades de los distintos árboles 
medidos (altura, diámetro, etc.), ahora ofrecen muchas más posibilidades si se 
considera que cada uno de estos árboles ha sido medido en una parcela dada, la 
cual lleva asociadas unas coordenadas concretas. 

El trabajo que se desarrollaba en la hoja de cálculo con estos datos se puede 
incorporar al SIG, el cual además de las funciones de análisis estadístico incluye 
funciones de análisis espacial. De este modo, los resultados numéricos que se 
obtenían de esos análisis (volúmenes totales estimados, alturas medias, etc.) se 
amplían mediante resultados con mayor componente espacial, como puede ser 
la creación de nueva cartografía referente a las variables principales (mapas de 
densidad media de arbolado, altura dominante media, etc.). 

En resumen, el SIG en su concepción actual es una herramienta integradora 
que busca abarcar en su ámbito todas las funcionalidades que se requieren para 
el trabajo con variables y elementos espacialmente localizados, incorporando para 
ello capacidades variadas que serán las que vayamos viendo progresivamente a lo 
largo de esta obra. 
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1.3. ¿Qué es un SIG? 

Partiendo del ejemplo anterior, podemos dar una definición más precisa y 
formal de lo que realmente es un SIG. Básicamente, un SIG ha de permitir la 
realización las siguientes operaciones: 

■ Lectura, edición, almacenamiento y, en términos generales, gestión de datos 
espaciales. 

■ Análisis de dichos datos. Esto puede incluir desde consultas sencillas a la 
elaboración de complejos modelos, y puede llevarse a cabo tanto sobre la 
componente espacial de los datos (la localización de cada valor o elemento) 
como sobre la componente temática (el valor o el elemento en sí) . 

■ Generación de resultados tales como mapas, informes, gráficos, etc. 

En función de cual de estos aspectos se valore como más importante, encontra- 
mos distintas definiciones formales del concepto de un SIG. Una definición clásica 
es la de [1], para quien un SIG es un elemento que permite «analizar, presentar e 
interpretar hechos relativos a la superficie terrestre». El mismo autor argumenta, 
no obstante, que «esta es una definición muy amplia, y habitualmente se emplea 
otra más concreta. En palabras habituales, un SIG es un conjunto de software y 
hardware diseñado específicamente para la adquisición, mantenimiento y uso de 
datos cartográficos». 

En una línea similar, [2] define un SIG como un «sistema de información 
diseñado para trabajar con datos refer enciados mediante coordenadas espaciales o 
geográficas. En otras palabras, un SIG es tanto un sistema de base de datos con capa- 
cidades específicas para datos geor refer enciados, como un conjunto de operaciones 
para trabajar con esos datos. En cierto modo, un SIG es un mapa de orden superior» . 

Ambas definiciones recogen el concepto fundamental de los SIG en el momento 
en que fueron escritas, pero la realidad hoy en día hace necesario recoger otras ideas, 
y la definición actual de un SIG debe fundamentarse sobre todo en el concepto 
de sistema como elemento integrador que engloba a un conjunto de componentes 
interrelacionados . 

Como apunta [1], software y hardware son dos elementos primordiales del SIG, 
pero no son sin embargo los únicos. En el contexto actual, otros componentes 
juegan un papel igual de importante en la ideal global de un SIG. 

De igual modo, un SIG puede considerarse como un «mapa de orden superior» 
entendiendo que se trata de una forma más potente y avanzada de hacer todo 
aquello que, previamente a la aparición de los SIG, se llevaba a cabo mediante el 
uso de mapas y cartografía en sentido clásico. Es decir, los SIG representan un paso 
más allá de los mapas. No obstante, esta definición resulta en exceso simplista, pues 
mapas y SIG no son conceptos equiparables en el contexto actual de estos últimos. 

Un mapa es una representación de un conjunto de datos espaciales y, aunque 
esta representación resulta de enorme importancia, en el entorno de un SIG no 
es sino un elemento más de una serie de componentes (tales como el software y el 
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hardware que antes mencionábamos) . Más aún, un SIG contiene no solo los datos y la 
representación, sino también las operaciones que pueden hacerse sobre el mapa, que 
no son ajenas a este sino partes igualmente de todo el sistema conformado por el SIG. 

De la misma forma que los textos han pasado del papel al ordenador (antes 
leíamos libros, ahora podemos leer libros impresos, libros digitales, páginas Web, 
etc.), los mapas también han dado ese salto cualitativo con la aparición de los 
SIG. Sin embargo, el SIG es mucho más que una nueva forma de cartografía, y no 
invalida en absoluto formas anteriores. De hecho, una función muy importante de 
los SIG es ayudar a crear mapas en papel, y estos se siguen utilizando hoy en día 
en todos los ámbitos. Y junto con esta funcionalidad, encontramos otras que hacen 
que en su conjunto un SIG sea una herramienta integradora y completa para el 
trabajo con información georreferenciada. 

Debe entenderse, pues, un SIG, como un elemento complejo que engloba una 
serie de otros elementos conectados, cada uno de los cuales desempeña una función 
particular. Estos elementos son, como iremos viendo más adelante, los datos, 
los procesos, la visualización, la tecnología y el factor organizativo. Baste por 
el momento citarlos, ya que más adelante, y a lo largo de todo el libro, se irán 
describiendo pormenorizadamente todos ellos. 

Con lo anterior, una definición más precisa es decir que un SIG es un sistema 
que integra tecnología informática, personas e información geográfica [3], y cuya 
principal función es capturar, analizar, almacenar, editar y representar datos 
georreferenciados [4]. 

En las siguientes secciones veremos por separado la forma en que un SIG integra 
la tecnología informática, las personas y la información geográfica, así como la 
forma en que los conceptos fundamentales en los que el propio SIG se sustenta 
suponen una integración de distintas disciplinas. 

1.3.1. SIG como integrador de información 

Si bien un SIG tiene una inherente naturaleza integradora y esta puede enfocarse 
desde muchos puntos de vista tal y como vemos en este apartado, el elemento tal vez 
más relevante en este sentido es la propia información que un SIG maneja y las carac- 
terísticas de esta. Conceptualmente, el verdadero pilar de esa naturaleza integradora 
del SIG reside en la información geográfica con la que se trabaja, que provee la amal- 
gama adecuada para que un SIG sea un sistema sólido y cohesionado, confiriéndole 
a su vez sus propias características y su interés como herramienta polivalente. 

Muchas disciplinas trabajan con información de distinta naturaleza. En ellas, no 
siempre resulta sencillo buscar elementos en común para poder unir y coordinar toda 
esa información bajo un único punto de vista conceptual. En otras ocasiones, discipli- 
nas que en la práctica presentan una interacción real (puede decirse que, de un modo 
u otro, todas las disciplinas están interrelacionadas) resultan difíciles de integrar des- 
de el punto de vista teórico, y no es sencillo ponerlas en un marco común de trabajo. 
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Por ejemplo, información de tipo sociológico como la tasa de analfabetismo 
e información de carácter físico o biológico como puede ser la acidez del suelo, 
no parecen sencillas de combinar para la realización de algún análisis común. De 
existir alguna relación entre ellas (o de no existir, y pretender demostrar que son 
variables independientes), es necesario buscar un punto de enlace entre ambas 
informaciones para poder estudiar esta. Un nexo que las une es el hecho de que 
están asociadas a una localización en el espacio, ya que una serie de datos de tasa 
de analfabetismo corresponderán a una serie de lugares, del mismo modo que lo 
harán los valores de acidez del suelo. 

El hecho de que ambas informaciones tienen a su vez carácter geográfico va 
a permitir combinarlas y obtener resultados a partir de un análisis común. Puesto 
que, tal y como se mencionó al inicio de este capítulo, aproximadamente un 70% 
de toda la información está georrefer enciada, esa georreferencia va a representar 
en una gran mayoría de los casos un punto común para enmarcar el análisis. El 
SIG es, en este contexto, el marco necesario en el que incorporar esa información 
georreferenciada y trabajar con ella. 

1.3.2. SIG como integrador de tecnologías 

Puede pensarse que los SIG son meramente herramientas informáticas y que 
la única tecnología que reside tras ellas es la propia tecnología informática. Sin 
embargo, el papel integrador de los SIG hace que sean la herramienta elegida para 
la gestión de resultados y elementos producidos por otras tecnologías, muchas de 
las cuales se encuentran actualmente en pleno desarrollo. 

La popularización de los SIG y su mayor presencia en una buena parte de los 
ámbitos de trabajo actuales han traído como consecuencia una mayor conciencia 
acerca de la importancia de la componente espacial de la información, así como 
sobre las posibilidades que la utilización de esta ofrece. Por ello, una gran parte de 
las tecnologías que han surgido en los últimos años (y seguramente de las que surjan 
en los próximos) se centran en el aprovechamiento de la información espacial, y 
están conectadas en mayor o menor medida a un SIG para ampliar su alcance y 
sus capacidades. Por su posición central en el conjunto de todas las tecnologías, los 
SIG cumplen además un papel de unión entre ellas, conectándolas y permitiendo 
una relación fluida alrededor de las funcionalidades y elementos base de un Sistema 
de Información Geográfica. 

1.3.3. SIG como integrador de personas 

Ya sabemos que la información georrefenciada es muy numerosa y variada. 
Esto significa que son muchos los tipos de personas que pueden emplearla y, por 
tanto, que pueden emplear un SIG para el trabajo con ella. La presencia del 
SIG como puerta de acceso a esa información es un punto común a todas esas 
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distintas personas, y un Sistema de Información Geográfica es también un elemento 
integrador a nivel humano y profesional. 

Dentro incluso de un mismo campo de aplicación, son varios los grupos de 
personas que van a estar implicados en el desarrollo de una tarea dada con la ayuda 
de un SIG. Desde la creación del dato geográfico hasta la obtención de un resultado 
final son muchas las operaciones que se llevan a cabo, y estas las desarrollan profe- 
sionales de distinta especialización y con herramientas particularmente adaptadas 
a dichas operaciones. En nuestro ejemplo, y en la etapa previa a la aparición de 
los SIG, las herramientas que emplea el cartógrafo para generar un mapa son muy 
diferentes de las que emplea el gestor para analizar dicho mapa, y estas a su vez 
distintas a las que pueden emplearse para la elaboración de resultados. 

Con la aparición de los SIG, todos los profesionales dentro de esa cadena que 
va desde el creación del dato hasta las operaciones finales que se realizan sobre 
estos tienen una herramienta común de trabajo, pues un SIG puede utilizarse para 
desarrollar parcial o totalmente las tareas correspondientes a cada uno de ellos. 
El SIG es empleado para crear cartografía, para almacenar, gestionar y consultar 
esta, así como para realizar análisis más complejos en base a ella y crear resultados. 

Las funciones básicas que un SIG ha de cumplir, que ya vimos en el momento 
de dar una definición de estos, cubren en realidad un rango amplio de trabajo, y 
engloban las necesidades de usuarios que con anterioridad no tenían entre sí un 
marco de trabajo común tan definido. Esto tiene como consecuencia que existe 
una mejor coordinación entre ellos, pues es la propia herramienta quien establece 
las características de la relaciones existentes, y estas no dependen ya únicamente 
del propio ámbito de aplicación. No obstante, aparece una mayor necesidad de 
organización, y como veremos más adelante, esta organización es una de las partes 
básicas del sistema SIG y un elemento necesario para su buen funcionamiento. 


1.3.4. SIG como integrador de teorías y fundamentos. La Ciencia 
de la Información Geográfica 

La evolución conceptual que se ha producido en el ámbito de los SIG, pasando 
como ya hemos visto de ser considerados simples programas informáticos a sistemas 
completos con múltiples componentes, ha tenido lugar también en la ciencia que los 
rodea. Los SIG no solo han contribuido al desarrollo de las ciencias afines, sino que 
en muchos casos han modificado estas o han contribuido a la formación de nuevas 
ramas. Conceptos básicos y hasta ese momento sólidos, como por ejemplo la idea 
de lo que es y lo que significa un mapa (una idea fundamental para el trabajo en 
muchas disciplinas), han sido literalmente redefinidas desde la aparición de los SIG. 

Desde un punto de vista muy simple, podemos entender un SIG como la unión 
de dos ciencias: la geografía y la informática. Visto así, un SIG es una herramienta 
informática para ayudar al trabajo en el ámbito geográfico. Esta concepción tan 
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simple dista, no obstante, mucho del concepto real de un SIG, pues este incorpora 
elementos de muchas ciencias distintas como pueden ser las siguientes [5]: 

■ Disciplinas relacionadas con la tecnología y el manejo de información. Se 
incluyen aquí las ciencias de la información, la informática, el diseño de 
bases de datos o el tratamiento digital de imágenes, entre otras. Muchas de 
estas, a su vez, derivan de otras o toman importantes elementos de ellas. La 
estadística o la matemática son algunas de esas ciencias fundamentales. 

■ Disciplinas dedicadas al estudio de la Tierra desde un punto de vista físico. La 
geología, la geología, la oceanografía, la ecología, así como todo el conjunto 
de ciencias medioambientales, forman parte de este grupo. 

■ Disciplinas dedicadas al estudio de la Tierra desde un punto de vista social 
y humano. En este grupo se incluyen la antropología, la geografía o la so- 
ciología, entre otras. Las ciencias de este grupo, así como las del anterior, 
son todas ellas potenciales usuarias de los SIG. 

■ Disciplinas dedicadas al estudio del entendimiento humano, en particular en 
lo concerniente a la interacción con máquinas. Las ciencias del conocimiento, 
la psicología en general o las ramas que estudian y desarrollan la Inteligencia 
Artificial también juegan su papel en el contexto actual de los SIG. 

■ Disciplinas que tradicionalmente han realizando una integración de cono- 
cimientos de otros ámbitos distintos. La geografía como tal es la principal 
representante de este grupo. 

En el contexto presente, podemos entender la Ciencia de la Información Geo- 
gráfica 2 como todo el conjunto de disciplinas y conocimientos que residen tras los 
SIG, tanto en su desarrollo y creación como en su utilización y aspectos prácticos. 
Esta ciencia se enmarcaría a su vez dentro de ese último grupo de disciplinas 
integradoras, llevando más allá la idea de la geografía como área de conocimiento 
que engloba elementos de muchos otros ámbitos. 

El término geomática, formado a partir de los vocablos geografía e informática , se 
emplea con frecuencia para hacer mención a todo ese grupo de ciencias relacionadas 
con los SIG. No obstante, y como ya se ha comentado, no se refiere exclusivamente 
a esas dos disciplinas, sino que simplemente toma nombre de los dos bloques princi- 
pales de conocimiento a partir de los cuales se ha desarrollado la ciencia de los SIG. 

Si los SIG deben ser entendidos a día de hoy como un sistema, la ciencia que 
los define y en la que se fundamentan debe no solo describir y servir de soporte a 
su elementos, sino también atender a una de las características fundamentales de 
todo sistema: las interrelaciones existentes entre dichos elementos. Por esta razón, 
disciplinas tales como las ciencias del conocimiento juegan un papel importante 
en el ámbito de los SIG, pues son fundamentales para estudiar las relaciones entre 
dos de sus componentes como son la tecnología y el factor organizativo. 

2 Geographic Information Science en inglés, abreviado como GIScience o simplemente con 
el propio acrónimo GIS 
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En este libro desarrollaremos elementos provenientes de distintas disciplinas, 
centrándonos en aquellas ramas que tengan mayor relevancia desde el punto de 
vista del usuario de SIG, y con independencia de cuál sea la funcionalidad que 
este pueda buscar. Dejaremos de lado algunos aspectos sin duda importantes pero 
que atañen a otros enfoques distintos (como pueden ser, por ejemplo, el desarrollo 
de aplicaciones SIG o el diseño de entornos SIG corporativos), aunque no debe 
perderse de vista el hecho de que estos contenidos son también importantes dentro 
del sistema global de un SIG. 


1.4. ¿Qué no es un SIG? 

Es obvio que, pese a que su propia denominación indica específicamente que 
los SIG desarrollan su actividad con información geográfica y esta es necesaria 
para el trabajo con ellos, existen otras tecnologías que también pueden hacer uso 
directo de esa información y explotarla de formas alternativas. A medida que se 
ha ido redefiniendo el concepto de SIG, muchos elementos han ido entrando en el 
amplio paraguas actual del SIG, así como distintas disciplinas, según hemos visto 
y veremos más adelante. No obstante, esas propias disciplinas no han desaparecido 
como tales, y siguen existiendo de forma autónoma. Y cada una de ellas dispone de 
sus propias herramientas, las cuales pueden incluir también tecnologías o sistemas 
más complejos similares a los SIG pero con un enfoque distinto. 

La distinción entre estas y los SIG es notable, máxime a día de hoy, y es 
fácil localizar sin confusión las parcelas conceptuales y prácticas que cada una 
ocupa o las áreas en las que existe un cierto solape. Por esta razón, igual que es 
necesario definir qué es un SIG, resulta obligado presentar aquellas tecnologías que 
comparten caracteres comunes con el SIG (siendo el principal de ellos la utilización 
de información georreferenciada) , y que han seguido una evolución paralela hasta 
el punto de diferenciación actual. Ahora que ya sabemos lo que es un SIG, veamos 
qué otras herramientas similares, pese a compartir elementos comunes, no entran 
en la definición de SIG que hemos dado. 

Dos son las principales soluciones que deben conocerse por su relación directa 
con el ámbito SIG: Diseño Asistido por Ordenador (CAD 3 ) y AM/FM. 

Las aplicaciones CAD (Figura 1.1) permiten el diseño informatizado de ele- 
mentos muy diversos, que pueden ir desde una pieza industrial o la carrocería de un 
automóvil (tareas con poca relación con los SIG) a un edificio (con mayor relación 
con los SIG). El uso de herramientas CAD en disciplinas como la arquitectura 
para la creación de planos tiene cierta similitud con el uso de un SIG, y ambas 
herramientas se han nutrido la una de la otra en cuanto a sus funcionalidades. 
No obstante, siguen existiendo grandes diferencias que hacen que cada aplicación 

3 Computer- Aided Design 
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responda a unas necesidades concretas pese a la existencia de características 
comunes. De entre estas diferencias cabe destacar las siguientes [6] [7] 

■ SIG y CAD han sido diseñados para propósitos diferentes. El del SIG es 
reflejar la realidad, mientras que el del CAD es diseñar algo que no existe 
todavía. La creación es el elemento fundamental en el CAD, mientras que 
el estudio de una realidad ya creada constituye la base del SIG. 

■ El almacenamiento de datos es diferente debido al distinto enfoque. En los 
SIG se da mayor peso a la gestión de los datos, mientras que en el CAD la 
parte visual es preponderante, y el almacenamiento así lo refleja. Un dato 
SIG se almacena como un un dato geográfico complejo, mientras que en un 
CAD se almacena básicamente como un «dibujo», pues es ese el enfoque 
fundamental de trabajo. 

■ El volumen de datos en un SIG es ordenes de magnitud mayor, y ello implica 
una gestión de datos distinta y unas necesidades más elevadas en ese sentido. 
La escala de trabajo también alcanza dimensiones mayores, ya que, mientras 
que con ambas herramientas puede trabajarse en una extensión limitada, 
un CAD no esta pensado para gestionar datos de una superficie como la de 
un país, un continente o el planeta entero. 

■ No todos los tipos de datos de un SIG se pueden incorporar en un CAD. 
Los datos procedentes de la teledetección, por ejemplo, no forman parte del 
abanico de datos que un CAD puede manejar. 



Figura 1.1: Entorno de trabajo de una aplicación CAD. 

El CAD puede resultar suficiente para desarrollar algunas tareas propias de los 
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SIG, en particular las relacionadas con el diseño cartográfico. No obstante, algunas 
circunstancias ponen de manifiesto las carencias de una herramienta CAD para 
sustituir completamente a un SIG, al tener requerimientos para los que esta no 
puede ofrecer una solución. Entre estos requerimientos cabe citar los siguientes: 

■ Análisis, modelización, y gestión avanzada de datos espaciales. 

■ Trabajo con datos que cubren una gran superficie geográfica. Necesidad de 
utilizar diversos sistemas de proyección. 

■ Edición de datos por usuarios de distinto perfil y de modo concurrente. 

Por su parte, las siglas AM/FM (Automated Mapping/Facilities Management)' 1 
de uso poco habitual en nuestro idioma, hacen referencia a aplicaciones diseñadas 
para la gestión de infraestructuras generalmente de carácter público, tales como 
redes de alcantarillado, conducciones de gas o vías de circulación, entre otras. 

Las aplicaciones empleadas para estas tareas tienen dos bloques básicos: un 
bloque gráfico de visualización y otro de gestión de datos. Este último almacena 
los atributos asociados a los elementos gráficos, que son principalmente de tipo 
lineal (tuberías, redes de alumbrado, etc.). Otro tipo de elementos, tales como 
elementos poligonales, son difíciles de manejar en estos sistemas, ya que su diseño 
obedece a las necesidades existentes en su ámbito de utilización, y estas se sitúan 
mayoritariamente alrededor de las infraestructuras lineales. Sin embargo, incluso 
con este tipo de elementos las capacidades de una aplicación AM/FM no igualan 
a las de un SIG, ya que no incorporan otro tipo de información como la relativa 
a la topología (que describiremos con detalle en el capítulo 5). Esto es así debido a 
que el subsistema de análisis, fundamental en un SIG, no tiene presencia en estas 
herramientas, y por tanto sus características no incluyen aquellos componentes 
que sean necesarios exclusivamente para procesos de tipo analítico. 

Puede decirse, por tanto, que este tipo de aplicaciones representa un subcon- 
junto de los SIG, pues sus funcionalidades principales son más reducidas que las 
de estos, y su ámbito de aplicación es menos generalista. En cierta medida, las 
aplicaciones AM/FM se asemejan también a las aplicaciones CAD, poniendo un 
énfasis especial en la componente gráfica, aunque con una mayor adaptación a la 
naturaleza geográfica de la información con la que se trabaja. 

Al contrario sin embargo de lo que sucede con las aplicaciones CAD, en la 
actualidad las labores propias asociadas a los productos AM/FM se pueden llevar 
a cabo en un SIG genérico, o bien en una adaptación de este que tenga en consi- 
deración las características particulares del ámbito de trabajo. En este sentido, 
la gestión de servicios no es una aplicación más específica que otras a la hora 
de emplear un SIG, y este en la actualidad engloba de forma casi completa las 
funcionalidades de una herramienta AM/FM. 


4 Cartografía Automatizada/Gestión de Servicios 
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1.5. Componentes de un SIG 

Como ya hemos visto, en su concepción actual los SIG son sistemas complejos 
que integran una serie de distintos elementos interrelacionados. El estudio de 
todos y cada uno de estos elementos es el fundamento para el estudio global de 
los Sistemas de Información Geográfica, y de ese modo se aborda a lo largo de 
este libro, mostrando las propias características de cada elemento y los conceptos 
necesarios para entender las relaciones entre ellos. 

Una forma de entender el sistema SIG es como formado por una serie de 
subsistemas, cada uno de ellos encargado de una serie de funciones particulares. 
Es habitual citar tres subsistemas fundamentales: 

■ Subsistema de datos. Se encarga de las operaciones de entrada y salida de 
datos, y la gestión de estos dentro del SIG. Permite a los otros subsistemas 
tener acceso a los datos y realizar sus funciones en base a ellos. 

■ Subsistema de visualización y creación cartográfica. Crea representacio- 
nes a partir de los datos (mapas, leyendas, etc.), permitiendo asila interacción 
con ellos. Entre otras, incorpora también las funcionalidades de edición. 

■ Subsistema de anáfisis. Contiene métodos y procesos para el análisis de los 
datos geográficos. 

Para que un SIG pueda considerarse una herramienta útil y válida con carácter 
general, debe incorporar estos tres subsistemas en cierta medida[8]. 

Otra forma distinta de ver el sistema SIG es atendiendo a los elementos bá- 
sicos que lo componen. Cinco son los elementos principales que se contemplan 
tradicionalmente en este aspecto (Figura 1.2): 

■ Datos. Los datos son la materia prima necesaria para el trabajo en un SIG, 
y los que contienen la información geográfica vital para la propia existencia 
de los SIG. 

■ Métodos. Un conjunto de formulaciones y metodologías a aplicar sobre los 
datos. 

■ Software. Es necesaria una aplicación informática que pueda trabajar con 
los datos e implemente los métodos anteriores. 

■ Hardware. El equipo necesario para ejecutar el software. 

■ Personas. Las personas son las encargadas de diseñar y utilizar el software, 
siendo el motor del sistema SIG. 

Para el enfoque de esta obra, cada uno de los elementos anteriores tiene unas 
características propias que deben estudiarse. No obstante, el hardware no es un 
elemento especialmente particular en el caso de un SIG, y las aplicaciones SIG 
que encontramos actualmente en el mercado en todas sus variedades (que son las 
que el lector de este libro va a utilizar habitualmente) se ejecutan en su mayoría 
sobre ordenadores personales sin requerimientos altamente específicos. Más aún, 
la expansión de las tecnologías SIG ha alcanzado hoy en día otros ámbitos como las 
plataformas móviles, haciendo de estas unas tecnologías poco específicas en lo que 
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Figura 1.2: Elementos que forman el sistema SIG 


a hardware se refiere. Por esta razón, no es necesario tratar en detalle esta pieza del 
sistema SIG, siendo más adecuado tratar el resto de elementos, más característicos 
e importantes para el aprendizaje de los conceptos SIG y la descripción de estos. 

Por su parte, las personas tienen importancia tanto de forma individual como 
en su conjunto, siendo diferentes las necesidades que plantean como usuarios y 
beneficiarios de un SIG. En la sociedad actual, las tecnologías y planteamientos 
colaborativos han calado hondo en el ámbito SIG, y la información geográfica es, 
por su propia naturaleza, propensa a ser compartida y utilizada por diferentes 
personas con fines muy distintos. Es por ello que el aspecto de mayor relevancia 
respecto a las personas como partes del sistema SIG es el de sus relaciones y su 
organización, siendo además en este campo donde se han producido en mayor 
medida los últimos avances, y donde ha tenido lugar un cambio más profundo, no 
ya solo dentro de los SIG, sino también en otras tecnologías de similar índole. 

Puede entenderse esto como un nuevo subsistema: el subsistema de gestión , 
que es responsable de gestionar la interacción de los restantes y definir y controlar 
el marco en que esta tiene lugar. 

Las personas a su vez dan forma a los distintos ámbitos de trabajo, definiendo 
estos en función de sus necesidades. Puede tratarse el conjunto de campos de 
especialización como un nuevo elemento del sistema SIG, en lugar de incorporarlo 
dentro de otro. 

Algunos autores proponen modificar el esquema clásico de cinco elementos 
para reflejar más correctamente la nueva realidad de los SIG. Por ejemplo, [9] 
propone un esquema como el mostrado en la figura 1.3. 

La incorporación de la visualización es una diferencia notable con respecto al 
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Figura 1.3: Una división distinta del sistema SIG (según [9]) 

esquema clásico. En realidad, y si volvemos a ese enfoque basado en subsistemas, 
el subsistema de visualización resulta de enorme importancia en un SIG, siendo 
pese a ello habitual que no sea tratado con la suficiente profundidad en textos 
dedicados a los SIG desde un punto de vista genérico. Precisamente por no ser 
considerado un elemento independiente, no se le concede la necesaria atención 
como parte que debe estudiarse al tratar la disciplina de los SIG. 

Esto contrasta con el hecho de que, a pesar de que las capacidades de los SIG 
son mucho más amplias que las relacionadas con la visualización, muchos usuarios 
usan estas por encima de las restantes, desconociendo incluso en muchos casos 
gran parte de las otras capacidades que un SIG puede brindarles. Correcto o no, 
desde el punto de vista del usuario medio, las capacidades de visualización están 
en primera línea del conjunto de funcionalidades de un SIG. 

Abordar el estudio de un SIG acudiendo al esquema clásico de cinco elementos 
deja de lado la visualización, en cuanto que la engloba como una funcionalidad de- 
rivada de dichos elementos en su conjunto pese a que esta tiene unas características 
peculiares en el entorno de un SIG y una vital importancia en la concepción actual 
de este. Es decir, el esquema de partes de un SIG no resulta el más adecuado para 
estructurar el estudio de los SIG, al menos en lo que respecta a la visualización 
como parte fundamental de estos. 

El objetivo de este libro es tratar con suficiente detalle y rigor todos los aspectos 
fundamentales de un SIG, incluyendo, por supuesto, la visualización de datos 
geográficos. Para ello, es conveniente tratar también esta desde un punto de vista 
teórico, detallando los fundamentos en los que se basa y que, pese a ser de vital 
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importancia para el uso de un SIG, son ignorados frecuentemente. 

Con todo lo anterior, resulta más conveniente para su estudio práctico adoptar 
una evolución del esquema clásico de cinco elementos, y establecer unos nuevos 
componentes, cada uno de los cuales actúa como un pilar conceptual sobre es que ha 
de sustentarse es estudio de la disciplina de los SIG. Estos componentes son cinco: 

■ Datos. 

■ Análisis. Métodos y procesos enfocados al análisis de los datos. 

■ Visualización. Métodos y fundamentos relacionados con la representación 
de los datos. 

■ Tecnología. Software y hardware SIG 

■ Factor organizativo. Engloba los elementos relativos a la coordinación en- 
tre personas, datos y tecnología, o la comunicación entre ellos, entre otros 
aspectos. 

A modo de introducción, se describen a continuación algunas ideas básicas de 
cada uno de estos componentes. Posteriormente, cada uno de ellos será tratado 
en detalle en una parte completa de este libro. 

Aunque no lo consideraremos como una parte del sistema SIG, el conjunto de 
ámbitos especializados de aplicación merece también atención separada, pues todo 
usuario de SIG deberá situarse en uno de ellos a la hora de llevar a cabo su trabajo. 
Por ello, dedicaremos igualmente una parte del libro a tratar las principales áreas 
de aplicación de los SIG. 

1.5.1. Datos 

Los datos son necesarios para hacer que el resto de componentes de un SIG 
cobre sentido y puedan ejercer su papel en el sistema. La información geográfica, 
la verdadera razón de ser los SIG, reside en los datos, y es por ello que el conoci- 
miento exhaustivo de los datos y su naturaleza resulta obligado para una buena 
comprensión los propios SIG. 

Son muchas las facetas de los datos que deben estudiarse, y todas ellas con 
una gran importancia. Por un lado, es necesario conocer las características fun- 
damentales del dato geográfico que utilizamos en un SIG, es decir, su forma y 
sus propiedades. De ellas dependen, por ejemplo, los procesos que podremos o no 
realizar con los datos, y en general todo cuanto podemos esperar de ellos. 

Prescindiendo del hecho de que se trata de un dato geográfico, es relevante 
conocer cómo los datos se gestionan y almacenan en un entorno digital, aspectos 
de corte puramente informático que desarrolla la disciplina de la gestión de bases 
de datos. Cuando las ideas fundamentales al respecto se aplican al caso particular 
de los datos geográficos, surgen conceptos que resultan básicos para un buen uso 
de un SIG, y que además van siendo cada vez más relevantes a medida que los 
volúmenes de datos de que se dispone van aumentando. 

Al igual que aumenta el volumen de datos, lo hacen los orígenes de estos y las for- 
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mas en que la información geográfica puede recogerse. Un aspecto clave para una uti- 
lización correcta de un SIG es saber integrar datos de distinta procedencia, para lo 
cual es vital entender cómo esta afecta a las propias características de dichos datos. 

Otros elementos tales como la calidad de los datos, la cual cobra cada día 
más importancia, serán tratados igualmente junto a los anteriores en una parte 
específicamente dedicada a los datos, probablemente una de las más importantes 
dentro de este libro. 

1.5.2. Análisis 

El análisis es una las funcionalidades básicas de los SIG, y una de las razones 
fundamentales que llevaron al desarrollo de estos. Un ordenador es una herramienta 
con enorme capacidad de cálculo, y esta puede aplicarse a los datos espaciales para 
obtener resultados de muy diversa índole. 

En mayor o menor medida, un SIG siempre incorpora una serie de formulaciones 
que permiten la obtención de resultados y el análisis de los datos espaciales. Estas 
formulaciones representan procesos que pueden ser sumamente sencillos o enorme- 
mente complejos, y que pueden resultar de aplicación en uno u otro campo, o incluso 
con carácter general. Su origen puede ser muy variado, y no derivan necesariamente 
del ámbito puro de la geografía, sino que pueden ir desde simples consultas o 
mediciones a elaborados modelos que empleen datos de variables muy numerosas 
y arrojen resultados complejos. La estadística, entre otras ciencias, puede aportar 
al ámbito SIG muchas de sus ideas, y estas, adaptadas al marco de la información 
georreferenciada, constituir en el SIG un nuevo conjunto de procesos de análisis. 

Las ventajas de la incorporación de todos estos procesos en una única herra- 
mienta, el SIG, van desde la automatización de tareas a la aparición de nuevos 
procesos que, aprovechando la gran capacidad de cómputo de la plataforma en 
la que se ejecuta el SIG, producen resultados que no podrían ser obtenidos de otro 
modo. Bien sea por la complejidad propia de los procesos o por el nivel de precisión 
al que se trabaja, existen muchos procesos que mediante el uso de cartografía 
clásica y sin el apoyo de medios informatizados no pueden realizarse. El SIG abre 
un campo de actuación en el que la práctica totalidad de ideas y formulaciones 
de análisis pueden plasmarse y aplicarse con carácter práctico. 

1.5.3. Visualización 

Cualquier tipo de información puede ser representada de forma gráfica, lo cual 
habitualmente facilita la interpretación de dicha información o parte de esta. Gran 
parte de las características de la información (por ejemplo, la presencia de patrones 
sistemáticos), son más fáciles de estudiar cuando se apoyan sobre algún elemento 
visual, pues este añade un nuevo punto de vista. 

En el caso particular de la información geográfica, la visualización no solo es una 
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forma más de trabajar con esa información, sino que resulta la forma principal, no ya 
por ser la que en general hace más fácil e intuitivo el tratamiento de esa información, 
sino porque es aquella a la que estamos más acostumbrados. La información geo- 
gráfica tiene una inherente naturaleza visual, ya que el espacio en sí es entendido de 
forma gráfica por el ser humano. Junto a esto, no debemos olvidar que la información 
geográfica se ha almacenado de forma tradicional de modo también visual, a través 
de mapas. Un mapa es en sí una representación visual de la información geográfica. 

Al contrario que un mapa, que de por sí es de naturaleza gráfica, en un SIG 
trabajamos con datos de tipo puramente numérico, ya que es así como el ordenador 
puede manejarlos, y la información geográfica debe almacenarse de este modo, 
como veremos con detalle en el capítulo 5. Para poder presentar una utilidad 
similar a la de un mapa en lo que a la presentación de la información respecta, un 
SIG debe incluir capacidades que generen representaciones visuales a partir de esos 
datos numéricos, aprovechando en la medida de lo posible las propias capacidades 
del medio informático en que se trabaja para hacer estas representaciones más 
potentes como transmisoras de información. 

Es deseable igualmente que el SIG sea capaz de generar cartografía clásica, y 
que incorpore métodos para el diseño cartográfico y la creación de mapas impresos, 
pues estos no pierden su vigencia pese a la existencia de los SIG. 

La visualización de la información geográfica se rige por los mismos conceptos y 
principios que se emplean para la confección de cartografía impresa, y estos deben 
ser conocidos por el usuario de SIG, ya que una de las tareas de este es el diseño 
cartográfico y las preparación de los elementos de visualización para poder realizar 
su trabajo sobre las representaciones creadas. A los conceptos tradicionales hay que 
sumar algunas ideas nuevas, ya que un SIG es capaz de generar representaciones más 
avanzadas (por ejemplo, representaciones tridimensionales). A esto hay que sumar 
la presencia de un elemento característico y de gran importancia como es la elevada 
interactividad que toda representación gráfica lleva asociada dentro de un SIG, y que 
constituye una gran diferencia frente al carácter estático de la cartografía clásica. 

Por todo ello, la visualización debe considerarse como un componente fun- 
damental del sistema SIG en su concepción actual, y particularmente uno con 
especial interés desde el punto de vista del usuario directo de tecnologías SIG. 

1.5.4. Tecnología 

Incluimos en este elemento tanto el hardware sobre el que se ejecutan las apli- 
caciones SIG, como dichas aplicaciones, es decir el software SIG. Ambos forman un 
binomio tecnológico en el que encontramos diversas alternativas, y que se enriquece 
diariamente con la rápida evolución del mercado tecnológico. 

En lo que a hardware respecta, es el elemento físico del sistema SIG, y conforma 
la plataforma sobre la que tiene lugar el trabajo con un SIG. La utilización de 
un SIG hoy en día se puede llevar a cabo en ordenadores personales o estaciones 
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de trabajo, y ya sea de forma individual o en una arquitectura cliente-servidor 
más compleja. Estas últimas han cobrado importancia muy rápidamente en los 
últimos tiempos, especialmente en lo que al acceso a datos se refiere. Veremos más 
adelante como esto también ha tenido influencia en otros componentes del sistema 
SIG, principalmente en el factor organizativo. 

Además de la propia plataforma, el hardware incluye una serie de periféricos 
para tareas más concretas. De uso habitual en el trabajo con SIG son los periféricos 
para entrada de datos geográficos y la creación de cartografía. Las tabletas digita- 
lizadoras son la forma más habitual dentro del primer grupo (las veremos con más 
detalle en el apartado 6.5.1), mientras que plotters e impresoras son empleados 
para la creación cartográfica, requiriéndose generalmente un mayor formato que 
para otros usos. 

Más recientemente, la aparición de Sistemas de Navegación Global como el 
GPS (que pueden a su vez considerarse como otro tipo de periféricos) ha creado 
una parcela tecnológica con gran relación con los SIG, convirtiendo a estos en 
herramientas ideales para la gestión de los datos de dichos sistemas. Incluso, la 
combinación de SIG y GPS sobre un único elemento de hardware ha dado lugar a 
herramientas como los navegadores GPS, que han supuesto un hito no solo desde 
el punto de vista técnico, sino también desde un enfoque social, pues acercan las 
tecnologías SIG a usuarios no expertos. 

Por su parte, el software es el encargado de operar y manipular los datos. El 
software SIG también ha sufrido una gran evolución, y bajo el paraguas de esa 
denominación encontramos desde las aplicaciones clásicas que permiten visualizar, 
gestionar y analizar los datos geográficos, hasta herramientas más especializadas 
que se centran en alguno de estos campos, o bien componentes que pueden incluso 
pasar a formar parte de otras aplicaciones fuera del ámbito SIG, pero que puntual- 
mente requieren algunas de sus funcionalidades, especialmente las relacionadas 
con la visualización de cartografía digital. 

1.5.5. Factor organizativo 

El sistema SIG requiere una organización y una correcta coordinación entre 
sus distintos elementos. El factor organizativo ha ido progresivamente ganando 
importancia dentro del entorno SIG, a medida que la evolución de estos ha ido 
produciendo un sistema más complejo y un mayor número de intrarelaciones e 
interrelaciones entre los distintos componentes que lo forman. 

Especialmente importante es la relación entre las personas que forman parte 
del sistema SIG, así como la relación de todos los elementos con los datos, sobre los 
cuales actúan de un modo u otro. Ello ha propiciado la aparición de, entre otros, 
elementos que pretenden estandarizar los datos y gestionar estos adecuadamente. 

Cuando los SIG se encontraban en sus etapas de desarrollo iniciales y eran meras 
herramientas para visualizar datos y realizar análisis sobre ellos, cada usuario tenia 
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sus propios datos con los cuales trabajaba de forma independiente del resto de 
usuarios, incluso si estos llevaban a cabo su trabajo sobre una misma área geográfica 
y estudiando las mismas variables. Hoy en día, la información no se concibe como 
un elemento privado de cada usuario, sino como un activo que ha de gestionarse, 
y del que deriva toda una disciplina completa.La aplicación de esta disciplina 
es la base de algunos de los avances más importantes en la actualidad, teniendo 
implicaciones no ya solo técnicas sino también sociales en el ámbito de los SIG. 

Asimismo, las necesidad de gestión de los datos y la propia complejidad de 
un SIG, provocan ambas que no exista un perfil único de persona involucrada en 
el sistema SIG, sino varias en función de la actividad que desarrollen. Al usuario 
clásico de SIG se unen las personas responsables de gestionar las bases de datos, las 
encargadas de diseñar la arquitectura de un SIG cuando este se establece para un 
uso conjunto por parte de toda una organización o grupo de mayor entidad. Dentro 
de las personas que participan en un SIG, el usuario directo es el eslabón último de 
una cadena que incluye igualmente a otros profesionales con roles bien distintos. 

Incluso atendiendo únicamente a los usuarios, también entre estos existen 
diferentes perfiles, y las comunidades de usuarios no expertos juegan en la actua- 
lidad un importante papel en el mundo del SIG. Esta situación, a su vez, requiere 
elementos organizativos importantes. Con la popularización y bajo coste de las 
unidades GPS y la aparición de la denominada Web 2.0, el SIG ha llegado a 
usuarios no especializados, los cuales utilizan estas herramientas para la creación 
y uso de su propia cartografía, dentro de lo que se conoce como VGI ( Volunteered 
Geographic Information 5 ) [10]. El término Neogeografía , de reciente creación, hace 
referencia a este uso de los SIG y otras herramientas asociadas por parte de grupos 
de usuarios no especializados. 

En definitiva, resulta necesario gestionar correctamente la complejidad del 
sistema SIG, y esta gestión se ha convertido ya en un elemento fundamental dentro 
del entorno SIG actual, por lo que debe ser estudiada igualmente. 


1.6. Resumen 

En este capítulo hemos presentado los SIG como herramienta para el manejo 
general de información geográfica, fundamental para trabajar hoy en día con todo 
tipo de información georreferenciada. Un SIG es un sistema compuesto por cinco 
piezas fundamentales: datos, tecnología, análisis, visualización y factor organiza- 
tivo. Cada una de ellas cumple un papel determinado dentro del sistema SIG, el 
cual se caracteriza fundamentalmente por su naturaleza integradora. 

Existen otras herramientas y tecnologías que pueden en principio asemejarse 
a los SIG, pero que realmente no comparten con estos su capacidad de integrar 

información geográfica creada voluntariamente 


bajo un marco común una serie completa de elementos y disciplinas, siendo esta 
la verdadera propiedad que define a los SIG. 

Todo el conjunto de conocimientos sobre los cuales se asientan los SIG confor- 
man la denominada Ciencia de la Información Geográfica. Bajo esta denominación 
se recogen todos los temas a tratar en esta obra. 
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Capítulo 2 


Historia de los SIG 


Antes de comenzar a estudiar en profundidad los Sistemas de Información Geográfica 
y sus elementos constituyentes, así como la ciencia que definen, es conveniente ver cómo 
se ha llegado hasta la situación actual a partir de los esfuerzos llevados a cabo en diversas 
direcciones. Estudiar la evolución y desarrollo de los SIG es ciertamente importante, en 
la medida en que nos encontramos ante una disciplina compleja que se nutre de muchas 
fuentes distintas. En este capítulo recorreremos el camino desde los primeros programas 
que establecieron las bases para el concepto de SIG, hasta llegar a la concepción moderna 
de este. De esta manera, será más sencillo entender más adelante el porqué de cada una 
de las partes de un SIG, su funcionalidad y su razón de ser. 


2.1. Introducción 

El desarrollo sufrido por los SIG desde sus orígenes hasta nuestros días es 
enorme. La popularización de las tecnologías y los esfuerzos de desarrollo llevados 
a cabo por un amplio abanico de ciencias beneficiarías de los SIG, todos han 
contribuido a redefinir la disciplina e incorporar elementos impensables entonces. 
No obstante, los componentes principales que identifican el núcleo principal de un 
SIG se mantienen a lo largo de todo ese desarrollo, y es su aparición la que define 
el momento inicial en el que podemos situar el origen de los SIG. 

Este momento surge al inicio de la década de los sesenta como resultado de unos 
factores que convergen para dar lugar al desarrollo de los primeros SIG. Estos fac- 
tores son principalmente dos: la necesidad creciente de información geográfica y de 
una gestión y uso óptimo de la misma, y la aparición de los primeros computadores. 

Estos mismos factores son los que desde entonces han seguido impulsando 
el avance de los SIG, ya que el interés en el estudio y conservación del medio se 
incrementa paulatinamente también hoy en día, y ello crea una situación ideal para 
la evolución de las técnicas y herramientas empleadas, muy particularmente los SIG. 

2.2. Los orígenes 

Las bases para la futura aparición de los SIG las encontramos algunos años an- 
tes de esa década de los sesenta, con el desarrollo de nuevos enfoques en cartografía 
que parecen predecir las necesidades futuras que un manejo informatizado de esta 
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traerá. Los trabajos desarrollados por John K.Wright en la Sociedad Geográfica 
Americana, en especial la publicación de su obra Elements of Cartography en 1953, 
son particularmente importantes. Obras como esta van ampliando el campo de la 
geografía cuantitativa hasta que este alcanza un nivel donde puede plantearse, una 
vez que la informática alcanza una cierta madurez, la unión de ambas disciplinas. 

La primera experiencia relevante en esta dirección la encontramos en 1959, 
cuando Waldo Tobler define los principios de un sistema denominado MIMO (map 
in-map out) con la finalidad de aplicar los ordenadores al campo de la cartografía. 
En él, establece los principios básicos para la creación de datos geográficos, su 
codificación, análisis y representación dentro de un sistema informatizado. Estos 
son los elementos principales del software que integra un SI G, y que habrán de 
aparecer en todas las aplicaciones desarrolladas desde ese momento. 

El primer Sistema de Información Geográfica formalmente desarrollado aparece 
en Canadá, al auspicio del Departamento Federal de Energía y Recursos. Este 
sistema, denominado CGIS (Canadian Geographical Information Systems), fue 
desarrollado a principios de los 60 por Roger Tomlinson, quien dio forma a una 
herramienta que tenía por objeto el manejo de los datos del inventario geográfico 
canadiense y su análisis para la gestión del territorio rural. El desarrollo de Tom- 
linson es pionero en este campo, y se considera oficialmente como el nacimiento 
del SIG. Es en este momento cuando se acuña el término, y Tomlinson es conocido 
popularmente desde entonces como «el padre del SIG». 

La aparición de estos programas no solo implica la creación de una herramienta 
nueva, sino también el desarrollo de técnicas nuevas que hasta entonces no habían 
sido necesarias. La más importante de ellas es la codificación y almacenamiento de 
la información geográfica, un problema en absoluto trivial que entonces era clave 
para lograr una usabilidad adecuada del software. El trabajo de Guy Morton con 
el desarrollo de su Matriz de Morton 1 juega un papel primordial[ll], superando 
las deficiencias de los equipos de entonces, tales como la carencia de unidades de 
almacenamiento con capacidad de acceso aleatorio, que dificultaban notablemente 
el manejo y análisis de las bases de datos. 

Simultáneamente a los trabajos canadienses, se producen desarrollos en Es- 
tados Unidos, en el seno del Harvard Laboratory, y en el Reino Unido dentro 
de la Experimental Cartography Unit. Ambos centros se erigen también como 
principales desarrolladores de software para la producción, manejo y análisis de 
información geográfica durante aquellos años. 

En el Harvard Laboratory, ve la luz en 1964 SYMAP, un aplicación que permitía 
la entrada de información en forma de puntos, líneas y áreas, lo cual se corresponde 
a grandes rasgos con el enfoque que conocemos hoy en día como vectorial. En la 
imagen 2.1 puede verse que los resultados cartográficos de este software son aún de 
poca calidad. No obstante, el interés que despertaron las novedosas capacidades 


1 Veremos con algo más de detalle este concepto en el capítulo 5 
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del programa para la generación de cartografía impulsó el desarrollo posterior y 
la evolución hacia sistemas más avanzados. 

En 1969, utilizando elementos de una versión anterior de SYMAP, David 
Sinton, también en el Harvard Laboratory, desarrolla GRID, un programa en el 
que la información es almacenada en forma de cuadrículas. Hasta ese momento, 
la estructura de cuadrículas regulares era solo utilizada para las salidas de los 
programas, pero no para la entrada y almacenamiento de datos. Son los inicios 
de los Sistemas de Información Geográfica ráster 2 . 
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Figura 2.1: Aspecto de un mapa generado con SYMAP 

SYMAP evoluciona y nuevos programas aparecen, tales como SYMVU (Figura 
2.2), con capacidad de representación tridimensional, o CALFORM, con nuevas ca- 
pacidades de representación y de generación de resultados impresos. GRID da lugar 
a IMGRID (Interactive Manipulation GRID), que sentará la base para el trabajo 
de Dana Tomlin con su paquete MAP, el cual incluye todos los elementos que hoy 
en día son imprescindibles para el análisis ráster (y que veremos en el capítulo 14) 

Si la década de los sesenta es la de los pioneros y las primeras implementaciones, 
la de los setenta es la de la investigación y el desarrollo. A partir de los SIG 
primitivos se va dando forma a un área de conocimiento sin duda con gran futuro, 
y se elabora una base sólida de conocimiento y de herramientas aptas para un uso 
más genérico. Sin haber entrado aún en la época del uso masivo y generalizado, los 
primeros paquetes comienzan a distribuirse y pasan a incorporarse a la comunidad 
cartográfica, lejos ya de ser el producto de unos pocos pioneros. 

A partir de este punto, el campo de los SIG recorre sucesivas etapas hasta 
nuestros días (Figura 2.3), evolucionando muy rápidamente ante la influencia 

2 los conceptos de SIG ráster y vectorial se tratan extensamente en el capítulo 5. No te preocupes 
si ahora no comprendes completamente qué representa cada uno de ellos y qué los diferencia. 
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Figura 2.2: Representación tridimensional creada con SYMVU 

de numerosos factores externos. Desde este punto, vamos a estudiar cómo esos 
factores han ido a su vez evolucionando y cómo su influencia ha condicionado el 
rumbo seguido por los SIG. Distinguiremos los siguientes elementos: 
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Figura 2.3: Esquema temporal de la evolución de los SIG. 

■ La evolución del SIG como disciplina. Cómo ha cambiado la presencia social 
de los SIG y su relación con otras disciplinas científicas, tanto influenciándolas 
como siendo influenciado por ellas. 

■ La evolución de la tecnología. Cómo ha variado el software SIG, así como 
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los ordenadores, periféricos y elementos informáticos de los que depende 
para su funcionamiento. 

■ La evolución de los datos . Cómo ha cambiado la generación de datos , su alma- 
cenamiento, y cómo esto ha condicionado el desarrollo de nuevas soluciones 
para su manejo. 

■ La evolución de las técnicas y formulaciones. Desde los elementos básicos 
de la cartografía cuantitativa, cómo se han desarrollado nuevos conceptos, 
enfoques, teorías o ramas de conocimiento de nueva aparición, que han 
dejado su huella en la evolución de los SIG. 


2.3. La evolución de los SIG como disciplina 

Como hemos visto, los SIG eran en origen una mera combinación de elementos 
de cartografía cuantitativa, enlazados con los sistemas informáticos de la época. 
Se trataba de un territorio propio de cartógrafos y geógrafos que intentaban 
adaptar sus conocimientos y necesidades a las tecnologías que por aquel entonces 
comenzaban a surgir. No obstante, desde aquellos orígenes los cambios han sido 
muy grandes, y se han incorporado al ámbito de los SIG un gran número de otras 
disciplinas cuya aportación e influencia puede ser equivalente o incluso superior 
a la de la cartografía o la geografía. 

La utilización del término «geográfico» para denominar a estos sistemas de 
manejo de información ha hecho que tradicionalmente, y a falta de una parcela de 
conocimiento propia bien delimitada, haya recaído en la geografía la tarea docente e 
investigadora relacionada con los SIG. No obstante, y dada la multidisciplinaridad 
del ámbito y su uso por grupos muy distintos hoy en día, no es necesariamente 
este el mejor enfoque [12]. En general, el conjunto de ciencias del medio y ciencias 
sociales han sabido todas ellas hacer uso de los SIG y aportar a estos los elementos 
propios de su ámbito. 

Si bien los orígenes del SIG están íntimamente ligados a la gestión forestal o 
la planificación urbanística, son muchas otras las disciplinas que han jugado un 
papel importante. Un elemento sin duda clave es la sensibilización medioambiental, 
que obliga a un estudio del medio mucho más detallado. Coincidiendo con la 
etapa inicial del desarrollo de los SIG, empieza a aparecer una preocupación por 
el entorno que tiene consecuencias muy favorables para el desarrollo de todas las 
ciencias relacionadas, la gran mayoría de las cuales son o serán usuarias directas 
de SIG. El SIG comienza a integrarse paulatinamente en las tareas de gestión del 
medio, como un apoyo imprescindible a la hora de analizar este. 

Al principio de la década de los setenta, siendo ya claro que los SIG son herra- 
mientas con gran futuro, aparecen no solo los esfuerzos de desarrollo y estabilización 
de la disciplina, sino todos los restantes que dan entidad propia a la prometedora 
ciencia de la información geográfica con base informática. 
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Así, a finales de septiembre de 1970, apenas media década después de que 
el CGIS fuera desarrollado, tiene lugar en Ottawa, Cañada, el primer Simposio 
Internacional de Sistemas de Información Geográfica. La celebración de eventos 
similares será ya una actividad en constante aumento desde entonces. 

Paralelamente, el SIG pasa a formar parte de los curricula universitarios y a 
constituirse en una disciplina bien diferenciada, al tiempo que el mercado editorial 
comienza a prestar atención a los SIG y aparecen obras clásicas que engloban 
toda la base conceptual de las herramientas modernas. Poco después, se crean las 
principales revistas especializadas que recogen los avances y tendencias de una 
ciencia en muy rápido desarrollo. 

En 1987 se empieza a publicar el International Journal Of Geographical Infor- 
mation Systems. Un año más tarde se funda en la Universidad Estatal de Nueva 
York, en Buffalo, la primera lista de distribución en Internet dedicada a los SIG, 
y arranca la publicación mensual GIS World. 

Los productos del Harvard Laboratory se habían vendido a precios módicos 
a otros investigadores para financiar su propio desarrollo, pero sin gran afán 
comercial. La incorporación de los SIG al mercado y la aparición de una industria 
basada en ellos aparece poco después del inicio de estos, al final de los años sesenta. 
En 1969, Jack Dangermond, un integrante del propio Harvard Laboratory, funda 
junto a su esposa la empresa Environmental Systems Research Institute (ESRI), 
pionera y líder del sector hasta el día de hoy. La popularización de los SIG y su 
conversión en un elemento de consumo es debida también en gran medida a la 
labor de ESRI dentro del mercado y a su línea original de productos. 

Esta popularización de la herramienta, acompañada de la disponibilidad cre- 
ciente de ordenadores personales, hace que los SIG pasen de ser elementos al 
alcance de unos pocos a estar disponibles para todos los investigadores en una gran 
variedad de ámbitos. La multidisciplinaridad de los SIG como útiles de trabajo para 
todas las ciencias del medio se ve reforzada a partir de este momento con continuas 
aportaciones por parte de estas y la aceptación del SIG como un elemento más 
dentro de innumerables campos de trabajo. 

Surgen nuevas empresas en el mercado, y en 1985 aparece el primer SIG libre, 
GRASS (Geographic Resources Analysis Support System), siendo aún en la ac- 
tualidad el referente dentro de su área. También en la década de los 80, comienzan 
a perder sentido los primeros desarrollos con los que comenzó el SIG, y programas 
tales como CGIS no se encuentran ya en condiciones de competir en el mercado, 
que se desarrolla muy rápidamente y va creando soluciones adaptables. 

En este sentido, es reseñable el hecho de que los SIG dejan de ser sistemas 
completos y pasan a ser plataformas adaptables sobre las que construir soluciones 
particulares. Los SIG se convierten en herramientas base para todo ese gran 
conjunto de disciplinas beneficiarías, cada una de las cuales adapta y particulariza 
estos a la medida de sus necesidades. 

Con el paso del tiempo, los SIG van confluyendo y los diversos enfoques se 
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unen para constituir una base útil sobre la que construir nuevos desarrollos. Los 
SIG ráster incluyen cada vez más elementos vectoriales, los SIG vectoriales cada 
vez más elementos ráster, y en ambos se van implementando formulaciones que 
trabajan con ambos formatos de almacenamiento y los combinan. De forma similar, 
los procesos para análisis de imágenes van ganando su espacio dentro de los SIG 
generales, aunque no dejan de existir aplicaciones específicas en este terreno. 

Por último, respecto a su presencia social, en nuestros días los SIG han pasado 
de elementos restringidos para un uso profesional a ser elementos de consumo y 
estar presentes en nuestra vida diaria. Un ejemplo de ello es la aparición de servicios 
como Google Maps [13] y la multitud de aplicaciones con interfaces Web basadas en 
él que permiten acceder a información geográfica de toda clase. De la mano también 
de Google , Google Earth[ 14] es otra aplicación popular que no está restringida al 
uso profesional. Estas aplicaciones acercan los SIG a usuarios no especializados, 
dándoles la posibilidad de utilizarlos y aprovechar parte de sus capacidades. 

La popularización de los navegadores GPS, que incorporan tanto elementos 
de representación como de análisis propios de los SIG, son otro buen ejemplo. 


2.4. La evolución de la tecnología 

La tecnología sobre la que se basan los SIG es clave para entender todo lo 
relacionado con ellos, especialmente su evolución a lo largo del tiempo. Desde los 
primeros SIG muy lejos del alcance de un usuario medio, hasta las aplicaciones 
de escritorio o los elementos derivados de los SIG que son de uso habitual hoy en 
día, se ha producido un cambio enorme que, como cabe esperar, es paralelo al que 
la propia tecnología ha sufrido. 

Tres son los bloques principales del desarrollo informático con una influencia 
más marcada en el campo de los Sistemas de Información Geográfica [15]: 

■ Salidas gráficas. Sin las capacidades de representación gráficas de hoy 
en día, puede parecemos imposible el uso de un SIG, ya que, aunque los 
procesos de análisis son una parte imprescindible y definitoria del mismo 
y pueden llevarse a cabo sin necesidad de visualización, esta visualización 
es una herramienta fundamental de un SIG. No obstante, tanto los prime- 
ros ordenadores como las primeras impresoras dedicadas a la impresión de 
mapas carecían de dichas capacidades. Como puede verse en la figura 2.1, 
las representaciones en esos tiempos se basaban en el uso de caracteres y no 
en gráficos puramente dichos. 

La evolución de las capacidades gráficas, intensa desde esos inicios hasta 
nuestros días y aún muy activa, ha sido seguida de cerca por los SIG, que 
progresivamente van incorporando mejoras tanto en la representación en 
pantalla como en la generación de mapas impresos. 

■ Almacenamiento y acceso de datos. Desde el inicio, el almacenamiento 
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y acceso de datos ha sido un problema clave en el cual se han producido 
grandes avances. Por una parte, los problemas asociados a los grandes vo- 
lúmenes de información. Por otra, los relacionados con la lectura de estos, 
que ha de realizarse de forma fluida pese a dicho volumen. A medida que 
han ido aumentando las capacidades de almacenamiento y lectura, ha ido 
aumentando paralelamente el tamaño de los datos manejados, así como los 
soportes utilizados para ellos, y esta evolución paralela ha de continuar y 
condicionar la forma que adopten los SIG. 

■ Entrada de datos. Los datos geográficos utilizados en los primeros años 
de los SIG eran datos en papel que se digitalizaban y almacenaban mecá- 
nicamente en tarjetas perforadas en un único proceso mecánico. Hoy en día, 
y aunque veremos que las fuentes de datos han sufrido por su parte una gran 
evolución, sigue siendo necesaria la digitalización de una gran cantidad de 
datos. Desde esos sistemas mecánicos de tarjetas hasta los modernos equipos, 
la aparición de scanners de gran precisión y técnicas de digitalización au- 
tomáticas, entre otros, ha cambiado completamente el ámbito de la entrada 
de datos para su uso en un SIG. 

Además del avance de estos factores, la evolución general de los ordenadores 
afecta a todos los elementos de software que se ejecutan sobre ellos. De las grandes 
computadoras se pasa a los ordenadores personales, y los programas tales como 
los SIG realizan también esa transición de una a otra plataforma. 

La elaboración y análisis de cartografía se convierte a finales de los años 80 en 
una tarea que puede ya llevarse a cabo en equipos personales (PC) de bajo coste, 
lejos de las grandes máquinas y equipos dedicados de alto coste. 

En 1978, la recientemente creada empresa ERDAS adapta para el PC un 
software de análisis de imágenes denominado IMGGRID, y comienza a distribuir 
este junto con un hardware relativamente asequible para uso personal. El ERDAS 
400 System se convierte así en el primero de su clase con esas características. 

Paralelamente, Arclnfo, de la compañía ESRI, se convierte en 1981 en el pri- 
mer SIG que alcanza el ámbito de los ordenadores personales. Será también un 
producto de esta compañía, ArcView, el que en 1991 pase a popularizar el SIG 
como herramienta de escritorio. 

A mitad de los 80, Arclnfo y ERDAS comienzan a distribuirse de forma con- 
junta en un producto comercial que integra el análisis vectorial con el tratamiento 
de imágenes dentro del entorno de un PC. 

La evolución de las plataformas no se detiene ahí. Las tendencias actuales 
apuntan a llevar los SIG de forma genérica a plataformas móviles tales como 
teléfonos o tabletas, especialmente indicadas para la toma de datos en campo. La 
combinación de estos últimos con las tecnologías de posicionamiento global como 
el GPS se demuestra altamente práctica en este aspecto. 

Elementos de SIG se incluyen también en los navegadores GPS cada día más 
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populares, confirmando la tendencia de adaptar los SIG a los dispositivos portátiles, 
tanto para el análisis como para la consulta de la información geográfica. 

La aparición de Internet es un hecho que ha modificado todos los aspectos de 
la sociedad actual, estén relacionados o no con ámbito científico. Los SIG no son, 
como cabe esperar, una excepción a esto, e Internet ha jugado un papel decisivo 
en redefinir el concepto de SIG que hoy conocemos. 

El nacimiento de la World Wide Web (WWW) puede establecerse a finales 
de 1989, pero no será hasta 1993 cuando empiece a utilizarse directamente para 
actividades relacionadas con los SIG o la distribución de cartografía. En esta 
fecha aparece Xerox PARC, el primer servidor de mapas. Mapserver, uno de los 
principales servidores de cartografía en la actualidad, aparece a mediados de 1997. 

El primer atlas digital en linea es el Atlas Nacional de Canadá, que se encuentra 
disponible desde 1994. Otros como MultiMap o MapQuest, que alcanzan gran 
popularidad, aparecen en 1996 y establecen la línea a seguir por otros servicios 
de Internet relacionados con la información geográfica. 

En 2005 aparece Google Maps[13], que además de ofrecer servicios de carto- 
grafía permite desarrollar nuevas aplicaciones sobre dichos servicios a través de 
una interfaz de programación abierta y documentada. Los conceptos de la Web 
2.0 se adaptan así al ámbito de los SIG. El número de ideas y funcionalidades ba- 
sados en Google Maps crece exponencialmente desde prácticamente su nacimiento, 
extendiendo la tecnología SIG a campos casi insospechados y muy distintos de 
los que originalmente constituían el ámbito de uso de los SIG. 


2.5. La evolución de los datos 

Los datos son el elemento principal del trabajo dentro de un SIG. Sin ellos, no 
tiene sentido un Sistema de Información Geográfica. Esta relación entre los datos 
y los elementos de software y hardware empleados en su manejo ha ejercido una 
notable influencia en el desarrollo de las tecnologías SIG y, recíprocamente, estas 
han definido el marco de trabajo para los avances en los tipos de datos. 

En los orígenes, los primeros SIGs dieron solución al problema de la codifica- 
ción de datos, e intentaron adaptar la cartografía disponible. Los primeros datos 
geográficos con los que se trabajaba provenían de la digitaliz ación de cartografía 
impresa. La primeras bases de datos geográficas contenían mapas escaneados y 
elementos digitalizados en base a estos. 

A partir de este punto, no obstante, van apareciendo nuevas fuentes de datos 
cuya estructura es más adecuada para su tratamiento informatizado, y al tiem- 
po que los SIG se adaptan a estas, surge una relación bidireccional que resulta 
beneficiosa para ambos. 

Un avance primordial en este sentido lo constituye el lanzamiento de los pri- 
meros satélites de observación terrestre. Las técnicas existentes para la toma de 


34 


Sistemas de Información Geográfica 


fotografías aéreas, desarrolladas principalmente con fines militares durante la 
Primera Guerra Mundial, pasan a ser aplicadas a escala global con la aparición 
de satélites destinados a estos efectos. 

El 1960, el primer satélite de observación meteorológico, el TIROS /, es lanzado 
al espacio. Dos años después, Rusia lanza su satélite Kosmos, y en 1974 el primer 
prototipo del satélite SMS-1 es puesto en órbita. 

Otros hitos importantes son los lanzamientos de los satélites LANDSAT 2 y 7 
en 1975 y 1999 respectivamente, cuyos productos son ambos de uso muy extendido 
(como veremos en el capítulo 6). 

El 1980 se funda SPOT, la primera compañía mundial en ofrecer con carácter 
comercial imágenes procedentes de satélite para toda la superficie terrestre. A este 
hecho le seguiría el lanzamiento de un buen número de nuevos satélites con o sin 
fines comerciales. Los productos de la teledetección pasan a constituir una fuente de 
negocio, al tiempo que se incorporan como elementos básicos del análisis geográfico. 

Las tecnologías de posicionamiento y localización son otra fuente de datos de 
primer orden. En 1981, el sistema GPS pasa a ser plenamente operativo, y en 2000 se 
amplía la precisión de este para uso civil. Este último hecho aumenta la penetración 
de la tecnología, pudiendo ya ser empleado el sistema para el desarrollo de elementos 
como navegadores GPS u otros productos derivados, hoy en día de uso común. 

Al igual que las aplicaciones, los distintos tipos de datos geográficos digitales 
se van asentando y popularizando, recibiendo progresivamente más atención y me- 
dios. El Servicio Geográfico Estadounidense (USGS) publica en 1976 los primeros 
Modelos Digitales de Elevaciones (MDE), en respuesta a la gran importancia que 
este tipo de dato tiene dentro del nuevo contexto del anáfisis geográfico. 

La evolución de los datos de elevación a nivel global llega a un punto histórico en 
el año 2000 con la Shuttle Radar Topographic Mission (SRTM). La SRTM es un pro- 
yecto conjunto dirigido entre la NASA y la National Imagery and Mapping Agency 
(NIMA), cuyo objetivo es ofrecer información altitudinal de un 80% de la superficie 
terrestre a una resolución de un segundo de arco (aproximadamente, 30 metros). 

La aparición de nuevas técnicas tales como el LiDAR (ver 6.4.2) abre nuevos 
caminos en cuanto a la precisión que puede obtenerse en la caracterización del 
terreno, posibilitando nuevos usos y análisis antes no planteados. 

La evolución de los datos no es solo una evolución técnica, sino también de 
carácter social y organizativo. En la denominada era de la información, el papel 
de los datos es tenido cada vez más en cuenta, y los esfuerzos para coordinar 
la enorme cantidad de datos espaciales y sus numerosas procedencias se hacen 
cada vez más relevantes. Se empieza a entender que resulta necesario formular 
estrategias adecuadas para la gestión de los datos espaciales. Estas estrategias 
pasan por la creación de las denominadas Infraestructuras de Datos Espaciales 
(IDE), a las cuales se dedica una capítulo completo de este libro. 

El ejemplo más destacado de estas es la IDE Nacional de los Estados Unidos 
(NSDI) [16] , surgida a raíz de la Orden Ejecutiva 12096, que fue promulgada en 1994 
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y tuvo una vital importancia en este ámbito. En Europa, la directiva INSPIRE[17] , 
con fecha 14 de marzo de 2007, pretende la creación de una infraestructura similar. 

Muchos de estos desarrollos y actividades se adhieren a las especificaciones 
establecidas por el Open GIS Consortium (OGC), un consorcio internacional 
fundado en 1994 para homogeneizar el empleo y difusión de los datos geográficos. 


2.6. La evolución de las técnicas y formulaciones 

Los problemas iniciales de los pioneros del SIG eran el desarrollo de los primeros 
programas — esto es, la mera implementación — y los relativos al almacenamiento 
y codificación de datos, como ya vimos. Las formulaciones de estos inicios eran las 
de la cartografía cuantitativa del momento, aún no muy desarrollada. Una vez que 
se implementan los primeros SIG y se suplen las necesidades de análisis y gestión 
de datos espaciales que motivaron su aparición, comienza el proceso de desarrollar 
nuevas técnicas y planteamientos que permiten ir más allá en dicho análisis. 

La cartografía cuantitativa sufre desde entonces un avance muy notable, arras- 
trada por las necesidades de los SIG en su propia evolución, y muchas disciplinas 
científicas desarrollan nuevas formulaciones que comienzan a tener como base los 
Sistemas de Información Geográfica. Algunas de ellas resultan especialmente rele- 
vantes y pasan a formar parte del conjunto habitual de herramientas y elementos 
de un SIG genérico. 

Como indica [18] la mayoría de los avances de cierta importancia dentro del 
mundo de los SIG han venido motivadas por las necesidad de una utilización 
concreta o por la tecnología en sí, y pocas veces por el desarrollo puro de una 
teoría. No obstante, e independientemente de las razones que lo motiven, los SIG 
han servido como contexto ideal para dar cuerpo a estas teorías, y su historia debe 
considerarse de forma pareja. 

Antes de que aparecieran los primeros SIG, los trabajos de algunos pioneros 
establecen bases que más tarde serán de gran importancia para otros avances. 
Junto con el ya citado Elements of Cartography de John K.Wright, los trabajos 
de Ian McHarg anticipan una forma de operar con los datos geográficos que más 
adelante va a convertirse en una constante del trabajo con estos dentro de un SIG. 
En su libro Design with N ature (1969), McHarg define los elementos básicos de la 
superposición y combinación de mapas, que, como veremos más adelante, son los 
que se aplican tanto en el análisis como en la visualización de las distintas capas 
de datos geográficos en un SIG. 

Aplicaciones de esta índole, en las cuales se combinan diversos mapas temáticos, 
ya se habían llevado a cabo con anterioridad. McHarg, sin embargo, es el encargado 
de generalizarlas como metodologías de estudio y análisis geográfico, asentando 
así los fundamentos que luego se introducirán dentro de los SIG. 

El trabajo de McHarg tiene, además, un fuerte componente medioambiental, 
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elemento que, como ya se ha dicho, es una de las razones que impulsan al desarrollo 
de los SIG como herramientas para una mejor gestión del medio. 

Antes de McHarg, ya se habían empezado a realizar análisis cartográficos, 
arrancando la línea que llega hasta los procedimientos que actualmente empleamos 
en un SIG. Más de cien años antes, John Snow (1813-1858) realizó la que puede 
considerarse como una de las primeras experiencias cartográficas analíticas, al 
utilizar mapas de puntos para efectuar sus deducciones y localizar en Inglaterra 
la fuente de un brote de cólera. 

Junto con la componente analítica, otros elementos de la práctica cartográfica 
evolucionan similarmente. En 1819, Pierre Charles Dupin crea el primer mapa 
de coropletas para mostrar la distribución del analfabetismo en Francia, dando 
un gran salto cualitativo en el diseño cartográfico, particularmente en un tipo de 
mapas de muy habitual creación dentro de un SIG. 

Una vez que los SIG ya han hecho su aparición, entre los elementos que más 
han impulsado el desarrollo de estos cabe destacar el gran avance en el estudio del 
relieve, de notable importancia por ser un elemento base para muchos otros análisis 
en un amplio abanico de ciencias afines. La orografía clásica, con un enfoque 
tradicionalmente sustentado en la geología y el análisis geomorfológico, va dando 
lugar a una ciencia cada vez más cuantitativa centrada en el análisis morfométrico 
del relieve. Trabajos como los de [19] sientan las bases para este tipo de análisis, 
que necesitan de un SIG para ser aplicados de forma efectiva. 

De igual modo sucede con la geoestadística, una rama de la estadística que 
aparece de la mano del francés Georges Matheron a principio de los años sesenta. 
Las formulaciones geoestadísticas, hoy parte característica de los SIG, son desarro- 
lladas en esa época desde el punto de vista teórico, aunque no son aplicables para un 
uso real si no es con el uso de ordenadores, y pierden gran parte de su valor práctico 
si no se realiza esta tarea con el concurso de Sistemas de Información Geográfica. 

En general, el desarrollo de la estadística encaminado a la adaptación de teorías 
y metodologías al ámbito espacial ha tenido un fuerte crecimiento en las últimas 
décadas, un hecho muy ligado a la aparición y evolución de los SIG. Uno de los hitos 
de este proceso es el desarrollo de [20], que extiende los modelos autoregresivos, de 
importancia clave para el análisis de la variación de series temporales, a los datos 
espaciales [21]. 

El desarrollo de otras ramas de conocimiento ha sido igualmente clave para 
el enriquecimiento de la ciencia del análisis geográfico. Muchas de ellas, por de- 
pender también en gran medida de la componente informática, ha evolucionado 
paralelamente a los SIG, pues el desarrollo de las tecnologías ha jugado un papel 
similar en ellas. 

Otro hecho importante es la aparición de los primeros programa de diseño 
asistido por ordenador (CAD) , que coincide con la de los SIG, allá por el final de los 
años sesenta. Originalmente pensados para el diseño industrial, pronto pasan a ser 
utilizados para el diseño arquitectónico y la delincación de elementos geográficos, 


y sus conceptos son incorporados paulatinamente a los SIG. Hoy en día, y cada 
vez con más frecuencia, los SIG incorporan capacidades similares a los sistemas 
CAD, que permiten tanto la digitalización de cartografía con las herramientas 
propias del CAD como la creación de nuevos elementos geográficos. Asimismo, los 
formatos habituales de las aplicaciones CAD son soportados por gran número de 
SIG, existiendo una cierta interoperabilidad, no obstante muy mejorable. Firmas 
como Autodesk tienen presencia en el mercado tanto del SIG como del CAD, 
compaginando ambas y compartiendo parcialmente soluciones y elementos. 

El avance en el desarrollo de las aplicaciones CAD, y en general de las representa- 
ciones gráficas por ordenador, impulsó igualmente la aparición y evolución posterior 
de una nueva disciplina: la geometría computacional. Esta denominación se emplea 
por primera vez en 1975 [22] , siendo hoy el nombre de una rama de la ciencia consoli- 
dada y en constante avance. Los algoritmos que componen la geometría computacio- 
nal son la base sobre la que se fundamenta el análisis vectorial dentro de un SIG. 

2.7. Resumen 

A principios de los años sesenta, el creciente interés por la información geográfi- 
ca y el estudio del medio, así como el nacimiento de la era informática, propiciaron 
la aparición de los primeros SIG. 

Desde ese punto hasta nuestros días, los SIG han ido definiéndose en base a 
la evolución de la informática, la aparición de nuevas fuentes de datos susceptibles 
de ser utilizadas en el análisis geográfico — muy especialmente las derivadas de 
satélites — , y del desarrollo de disciplinas relacionadas que han contribuido a 
impulsar el desarrollo propio de los SIG. 

Siendo en su origen aplicaciones muy específicas, en nuestros días los SIG son 
aplicaciones genéricas formadas por diversos elementos, cuya tendencia actual es 
a la convergencia en productos más versátiles y amplios. 
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Capítulo 3 


Fundamentos cartográficos y geodésicos 


Trabajar con información georreferenciada requiere conocer una serie de conceptos pre- 
vios necesarios para poder realizar correctamente todo tipo de operaciones. Estos conceptos 
no son exclusivos del ámbito de los SIG, sino que derivan de otras disciplinas que tradicio- 
nalmente han trabajado con este tipo de información, como por el ejemplo la cartografía. 

Los datos georreferenciados tienen además una peculiaridad como datos espaciales, 
pues son datos que se sitúan sobre la superficie de la Tierra. Por ello, es necesario tener 
un conocimiento preciso de la forma de esta, para así tratar con exactitud y rigor la 
información con que se trabaja en un SIG. La geodesia es la ciencia que se encarga del 
estudio de la forma de la Tierra, y sus fundamentos se encuentran entre los conceptos base 
de todo SIG, siendo por tanto necesario conocerlos para poder hacer uso de estos. 

En este capítulo veremos algunas ideas esenciales sobre cartografía y geodesia, que 
serán de aplicación constante y fundamental en el uso de cualquier SIG. 


3.1. Introducción 

La característica principal de la información georreferenciada es que tiene una 
localización en el espacio, particularmente en el espacio terrestre. Esta localización 
se ha de dar por medio de unas coordenadas que la definan de forma adecuada, lo 
cual implica la necesidad de establecer un sistema en base al cual expresar dichas 
coordenadas. 

Si medimos un dato de temperatura necesitamos un sistema de medición 
conocido, sin el cual el dato de temperatura en sí carece de valor y significado. Así, no 
es lo mismo decir que una temperatura es de 25 grados Celsius o que es de 25 grados 
Fahrenheit. Del mismo modo, si a esa temperatura le queremos asociar algún tipo de 
información espacial (por ejemplo, el punto exacto en el que fue medida), debemos 
establecer un sistema que permita dar sentido a las mediciones que realicemos, 
y que posteriormente nos sirva para interpretar los valores de las coordenadas y 
poder saber con exactitud dónde está el punto al que estas hacen referencia. 

El establecimiento de un sistema de referencia en el que expresar la situación 
de un punto dado no es en absoluto una tarea sencilla, y requiere el conocimiento 
de abundantes conceptos previos que van desde ideas físicas hasta complejos desa- 
rrollos matemáticos y geométricos. Los avances en este campo han sido constantes 
desde la antigüedad, y esta evolución es la que ha permitido que en la actualidad 
se puedan obtener resultados altamente precisos en el trabajo con información 
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georreferenciada. Gran parte de lo que podemos hacer en un SIG carecería de sen- 
tido si no se dispusiera de metodologías bien desarrolladas para el establecimiento 
de sistemas de referencia. 

La geodesia es la ciencia encargada de proveer el marco teórico en el que funda- 
mentar todo lo anterior, y es una disciplina compleja con diversas ramas de estudio. 
Todas ellas responden al objetivo básico de estudiar la forma de la Tierra, ya que de- 
bemos saber cómo es la Tierra para poder localizar puntos sobre su superficie. La de- 
terminación de la forma y dimensiones de la Tierra es tarea de la denominada geode- 
sia esferoidal , cuyo cometido coincide con el del concepto clásico de geodesia, esto es, 
la definición de la figura terrestre. No obstante, en la actualidad encontramos otras 
ramas como la geodesia física, encargada de analizar el campo gravitatorio terrestre 
y sus variaciones, o la astronomía geodésica , que utiliza métodos astronómicos para 
la determinación de ciertos elementos geodésicos muy importantes que veremos 
más adelante. En conjunto, todas estas ramas dan forma a una serie de métodos 
y conceptos que son los que van a permitir la utilización rigurosa de coordenadas. 

La necesidad del estudio geodésico surge por el hecho de que la Tierra no 
es plana, y cuando el territorio que pretendemos estudiar es lo suficientemente 
extenso, la curvatura de la Tierra no puede ser ignorada. Este es el caso que vamos a 
encontrar cuando trabajemos con un SIG, y es por ello que los SIG implementan los 
elementos necesarios para poder efectuar un manejo de la información geográfica 
riguroso y acorde con los conceptos de la geodesia. 

Vimos en el primer capítulo de esta parte que existen otras aplicaciones que 
trabajan con información georreferenciada, entre las cuales estaban los programas 
de diseño asistido por ordenador (CAD). Decíamos entonces que una de las prin- 
cipales limitaciones de estos era su mala disposición al trabajo con zonas extensas, 
ya que han sido diseñados para operar con zonas de unas dimensiones reducidas. 

Cuando un arquitecto diseña el plano de una casa con una aplicación CAD, no 
necesita emplear los conceptos de la geodesia, puesto que a esa escala la forma de la 
Tierra no tiene relevancia, y prescindiendo de ella puede expresar las coordenadas 
de los distintos elementos (un muro, un pilar, etc.) con la suficiente precisión y 
corrección como para que luego pueda construirse esa casa. Sin embargo, cuando un 
usuario de SIG estudia la cuenca vertiente de un río o la distribución de población 
en las comunidades autónomas de un país, o bien analiza las rutas migratorias de 
un ave entre dos continentes, los conceptos de la geodesia resultan fundamentales. 

En la actualidad, los SIG han hecho que la información geográfica tenga en 
muchos casos carácter global y cubra grandes extensiones o incluso la totalidad 
del planeta. Esto obliga más que nunca a hacer hincapié en los fundamentos 
geodésicos que resultan básicos para que toda esa información pueda manejarse 
correctamente, siendo de interés para cualquier usuario de SIG, con independencia 
de su escala de trabajo. 

Otro aspecto básico a la hora de trabajar en un SIG son las denominadas 
proyecciones cartográficas. Estas permiten transformar las coordenadas sobre la 
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superficie curva de la Tierra en coordenadas sobre una superficie plana. Esto es 
necesario para poder representarlas en un soporte plano tal como puede ser un mapa 
o la pantalla del ordenador, así como para poder analizarlas de forma más simple. 

Con los elementos de la geodesia y las proyecciones cartográficas ya podemos 
elaborar cartografía y estamos en condiciones de trabajar con la información 
georrefer enciada. No obstante, existen ciertos conceptos relativos a esa cartografía 
que resultan de suma importancia y deben conocerse antes de abordar esas tareas. 
El más importante de ellos es la escala, es decir, la relación entre el tamaño real 
de aquello que representamos y su tamaño en la representación, la cual constituye 
un factor básico de toda información cartográfica. 

La escala condiciona a su vez la aparición de otra serie de ideas y de procesos 
asociados, como por ejemplo la generalización cartográfica. Esta engloba los procedi- 
mientos que permiten que a cada escala se represente la información de la forma más 
adecuada posible, maximizando el valor de dichas representaciones. Aunque tanto 
la escala como la generalización cartográfica son conceptos muy vinculados a las pro- 
pias representaciones visuales de la información geográfica, y este libro contiene una 
parte dedicada específicamente a la visualización, se trata de conceptos cartográfi- 
cos fundamentales y por ello se incluyen en este capítulo, ya que resultan necesarios 
incluso si se trabaja con datos georreferenciados sin visualización alguna de estos. 


3.2. Conceptos geodésicos básicos 

A la hora de definir la forma y dimensiones de la Tierra, la geodesia plantea 
modelos que puedan recoger la complejidad natural de la superficie terrestre y 
expresarla de una forma más simple y fácil de manejar. 

Con estos modelos, uno de los objetivos principales de la geodesia es establecer 
un sistema de referencia y definir un conjunto de puntos (conocidos como vértices 
geodésicos) cuyas coordenadas en dicho sistema sean conocidas con una precisión 
elevada. Posteriormente, y en base a esos puntos, los cuales forman una red geo- 
désica , se pueden calcular las coordenadas de cualquier punto en el sistema de 
referencia definido. 

Los vértices geodésicos se establecen por triangulación a partir de un punto 
único determinado por métodos astronómicos. En función de la longitud de los 
lados de los triángulos empleados en dicha triangulación, tenemos redes de mayor 
o menor precisión. 

Veamos ahora cómo establecer los elementos necesarios para establecer ese 
sistema de referencia base y definir esos modelos de partida citados. A la hora 
de buscar un modelo al que asimilar la forma de la Tierra, existen dos conceptos 
básicos: el elipsoide de referencia y el geoide. 
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3.2.1. Elipsoide de referencia y geoide 

El intento más básico de establecer un modelo de la forma de la Tierra es asimilar 
esta a una figura geométrica simple, la cual pueda expresarse mediante una ecuación 
matemática. Además de ser más sencilla de manejar, disponer de esta ecuación ma- 
temática permite la aplicación de conceptos geométricos, estableciendo así una base 
práctica para el trabajo con coordenadas y la definición de sistemas de referencia. 

Desde la antigüedad, se han formulado numerosas hipótesis sobre la forma que 
la Tierra tenía, las cuales van desde suponer la Tierra plana a admitir la evidencia de 
que esta ha de tener forma esférica (o similar) si se atiende a diversos hechos como, 
por ejemplo, el movimiento circular de las estrellas o la existencia de horizonte. 

En realidad, la Tierra no es una esfera perfecta, ya que su propia rotación ha 
modificado esa forma y ha provocado un achatamiento en los polos. Esta hipótesis 
fue ya planteada por Newton, y corroborada posteriormente con numerosas expe- 
riencias. No obstante, podemos seguir tratando de asimilar la forma de la Tierra 
a la de una superficie teórica, aunque no ya la de una esfera sino la de lo que se 
denomina un elipsoide. Sobre un elipsoide, el radio de la Tierra ya no es constante, 
sino que depende del emplazamiento. 

Suponer que la Tierra es una esfera no es una aproximación tan mala como 
puede parecer (las representaciones gráficas a las que estamos acostumbrados 
exageran habitualmente mucho el achatamiento del planeta) , aunque el elipsoide es 
más preciso y necesario a la hora de elaborar cartografía de zonas no muy extensas. 
A gran escala, sin embargo, y para determinadas tareas, es habitual suponer la 
Tierra con una forma perfectamente esférica. 

Como se muestra en la figura 3.1, un elipsoide viene definido por dos parámetros: 
el semieje mayor y el semieje menor. En el caso de la Tierra estos se corresponderían 
con el radio ecuatorial y el radio polar respectivamente. La relación existente entre 
estas dos medidas define el grado de achatamiento del elipsoide. En particular, se 
establece un factor de achatamiento según 

/= D-T2 

r\ 

siendo r\ el semieje mayor y r 2 el semieje menor. 

El elipsoide es la forma geométrica que mejor se adapta a la forma real de la 
Tierra, y por tanto la que mejor permite idealizar esta, logrando un mayor ajuste. 

Una vez que se dispone de una expresión teórica para la forma de la Tierra, el 
siguiente paso es la determinación de los parámetros que definen esta. En el caso de 
utilizar la esfera, hay que calcular su radio. En el caso de asumir el elipsoide como 
forma de referencia, deben determinarse las medidas de los semiejes menor y mayor. 

Debido a la evolución histórica de la idea de elipsoide de referencia, las medidas 
de los semiejes que lo definen no son únicas. Es decir, no en todos lugares y en todas 
las circunstancias se emplea un mismo elipsoide caracterizado por unos valores r\ y 


(3.2.1) 
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Polo 


Ecuador 


Figura 3.1: Parámetros que definen el elipsoide 


r 2 idénticos. Esto es debido principalmente al hecho de que un determinado elipsoide 
no se adapta de modo igualmente preciso a todas las regiones terrestres, y el elipsoide 
que proporciona un mejor ajuste para un área dada (por ejemplo, un continente 
o país) puede no ser el mejor en otra zona de la Tierra alejada de la primera. 

A esto debe sumarse que los esfuerzos iniciales por determinar la forma de la 
Tierra y los parámetros del elipsoide de referencia fueron realizados en tiempos en 
los que la comunicación entre distintos puntos de la superficie terrestre no era la 
misma que hoy en día. Por ejemplo, los geodestas europeos de entonces realizaban 
un trabajo similar a sus colegas americanos, pero los datos con los que contaban 
eran bien distintos, pues las mediciones de cada grupo eran relativas a sus zonas 
de trabajo, ya que no resultaba sencillo desplazarse a otras partes del planeta a 
realizar una labor similar. 

De este modo, los geodestas de Europa tomaban sus datos y ajustaban a estos 
sus elipsoides, mientras que los de América hacían un trabajo similar y obtenían 
sus propios elipsoides. A la hora de establecer un elipsoide de referencia oficial, 
en cada zona (ya sea administrativa o geográfica) se tomaba el más idóneo, que 
no era el mismo en todas ellas. 

Si añadimos las diferencias tecnológicas y metodológicas que también existían en 
el proceso de recogida y procesado de datos, es fácil comprender que tengamos una 
larga serie de elipsoides, cada uno de los cuales ha sido empleado de forma regular 
en un país o grupo de países, o incluso a escala continental, pero no a nivel global. 

La tabla 3.1 muestra algunos de los elipsoides de uso más extendido en diversas 
partes del mundo, con sus correspondientes parámetros. 

La necesidad de trabajar con un elipsoide global para todo el planeta es más 
reciente, pero ya desde hace casi un siglo se hace patente que debe realizarse un 
esfuerzo por homogeneizar el uso de elipsoides, de tal modo que pueda trabajarse 
con una referencia internacional que facilite el uso de cartografía en las distintas 
zonas del planeta. Como consecuencia de esto, surgen los primeros elipsoides 
generales (en contraste con los elipsoides locales ), los cuales, además de buscar un 
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Elipsoide 

Semieje mayor 

Semieje menor 

i 

/ 

Australian National 

6378160.000 

6356774.719 

298.250000 

Bessel 1841 

6377397.155 

6356078.963 

299.152813 

Clarke 1866 

6378206.400 

6356583.800 

294.978698 

Clarke 1880 

6378249.145 

6356514.870 

293.465000 

Everest 1956 

6377301.243 

6356100.228 

300.801700 

Fischer 1968 

6378150.000 

6356768.337 

298.300000 

GRS 1980 

6378137.000 

6356752.314 

298.257222 

International 1924 (Hayford) 

6378388.000 

6356911.946 

297.000000 

SGS 85 

6378136.000 

6356751.302 

298.257000 

South American 1969 

6378160.000 

6356774.719 

298.250000 

WGS 72 

6378135.000 

6356750.520 

298.260000 

WGS 84 

6378137.000 

6356752.314 

298.257224 


Cuadro 3.1: Algunos elipsoides y sus parámetros característicos 


ajuste óptimo, han de cumplir las siguientes características: 

■ El centro de gravedad terrestre y el del elipsoide deben coincidir. 

■ El plano ecuatorial terrestre y el del elipsoide deben coincidir. 

El elipsoide WGS-84 es muy empleado en la actualidad, pues es el utilizado 
por el sistema GPS (apartado 6.6). 

El geoide es la otra superficie de referencia, definida como la superficie tri- 
dimensional en cuyos puntos la atracción gravitatoria es constante. Se trata de 
una superficie equipotencial que resulta de suponer los océanos en reposo y a un 
nivel medio (el nivel es en realidad variable como consecuencia de las mareas, 
corrientes y otros fenómenos) y prolongar estos por debajo de la superficie terrestre. 
La particularidad del geoide reside en que en todos sus puntos la dirección de la 
gravedad es perpendicular a su superficie. 

El geoide no es, sin embargo, una superficie regular como el elipsoide, y presenta 
protuberancias y depresiones que lo diferencian, como puede observarse en la figura 
3.2. La densidad de la Tierra no es constante en todos sus puntos, y ello da lugar 
a que el geoide sea una superficie irregular como consecuencia de las anomalías 
gravimétricas que dichas variaciones de densidad ocasionan. 

Lógicamente, el elipsoide, por su naturaleza más simple, no puede recoger toda 
la variabilidad del geoide, por lo que estas dos superficies presentan diferencias, 
cuyo máximo es generalmente del orden de ±100 metros. Estas diferencias se 
conocen como alturas geoidales. 

Al igual que en el caso de los elipsoides, existen diversos geoides de referencia, 
y estos no son constantes en el tiempo sino que evolucionan para adaptarse a las 
modificaciones que tienen lugar sobre la superficie terrestre. 
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Figura 3.2: Representación gráfica del geoide (Fuente: Misión GRACE (NASA)). 


Figura 3.3: Tres superficies fundamentales: superficie real de la Tierra, geoide y elipsoide 
(Adaptado de Wikipedia). 

La figura 3.3 muestra una comparación esquemática entre las tres superficies: 
superficie real de la Tierra, geoide y elipsoide. 

3.2.2. El datum geodésico 

Cuando se trabaja con un elipsoide general, este, como se ha dicho, se sitúa de 
tal modo que tanto la posición de su centro de gravedad como su plano ecuatorial 
coincidan con los terrestres. Por el contrario, cuando el elipsoide es local, estas 
propiedades no han de cumplirse necesariamente, y el elipsoide a solas resulta 
insuficiente ya que carecemos de información sobre su posicionamiento con respecto 
a la superficie terrestre. 

Surge así el concepto de datum, que es el conjunto formado por una superficie 
de referencia (el elipsoide) y un punto en el que «enlazar» este al geoide. Este 
punto se denomina punto astronómico fundamental (para su cálculo se emplean 
métodos astronómicos), o simplemente punto fundamental, y en él el elipsoide es 
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tangente al geoide. La altura geoidal en este punto es, como cabe esperar, igual 
a cero. La vertical al geoide y al elipsoide son idénticas en el punto fundamental. 

Para un mismo elipsoide pueden utilizarse distintos puntos fundamentales, que 
darán lugar a distintos datum y a distintas coordenadas para un mismo punto. 

3.3. Sistemas de coordenadas 

Disponiendo de un modelo preciso para definir la forma de la Tierra, podemos 
establecer ya un sistema de codificar cada una de las posiciones sobre su superficie 
y asignar a estas las correspondientes coordenadas. Puesto que la superficie de 
referencia que consideramos es un elipsoide, lo más lógico es recurrir a los elementos 
de la geometría esférica y utilizar estos para definir el sistema de referencia. De 
ellos derivan los conceptos de latitud y longitud, empleados para establecer las 
coordenadas geográficas de un punto. 

No obstante, la geometría plana resulta mucho más intuitiva y práctica que 
la geometría esférica para realizar ciertas tareas, y a raíz de esto surgen las pro- 
yecciones cartográficas, que tratan de situar los elementos de la superficie del 
elipsoide sobre una superficie plana, y que son los que se emplean para la creación 
de cartografía. Al aplicar una proyección cartográfica, las coordenadas resultantes 
son ya coordenadas cartesianas. 

Ambas formas de expresar la posición de un punto son utilizadas en la actua- 
lidad, y las veremos con detalle en esta sección. 

3.3.1. Coordenadas geográficas 

El sistema de coordenadas geográficas es un sistema de coordenadas esféricas 
mediante el cual un punto se localiza con dos valores angulares: 

■ la latitud es el ángulo entre la línea que une el centro de la esfera con un 
punto de su superficie y el plano ecuatorial. Las lineas formadas por puntos 
de la misma latitud se denominan paralelos y forman círculos concéntricos pa- 
ralelos al ecuador. Por definición la latitud es de 0°en el ecuador, que divide el 
globo en los hemisferios norte y sur. La latitud puede expresarse especificando 
si el punto se sitúa al norte o al sur, por ejemplo 24°, 21’ 11” N, o bien utilizan- 
do un signo, en cuyo caso los puntos al Sur del ecuador tienen signo negativo. 

■ la longitud A es el ángulo formado entre dos de los planos que contienen 
a la linea de los Polos. El primero es un plano arbitrario que se toma como 
referencia y el segundo es el que, ademas de contener a la linea de los po- 
los, contiene al punto en cuestión. Las líneas formadas por puntos de igual 
longitud se denominan meridianos y convergen en los polos. 

Como meridiano de referencia internacional se toma aquel que pasa por 
el observatorio de Greenwich, en el Reino Unido. Este divide a su vez el 
globo en dos hemisferios: el Este y el Oeste. La longitud puede expresarse 
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Figura 3.4: Esquema de los elementos del sistema de coordenadas geográficas. 


especificando si el punto se sitúa al Este o al Oeste, por ejemplo 32°, 12’ 43” 
E, o bien utilizando un signo, en cuyo caso los puntos al Oeste del meridiano 
de referencia tienen signo negativo. 

En la figura 3.4 puede verse un esquema de los conceptos anteriores. 

La tabla 3.2 recoge las coordenadas geográficas de algunas ciudades importan- 
tes, a modo de ejemplo. 

Las coordenadas geográficas resultan de gran utilidad, especialmente cuando 
se trabaja con grandes regiones. No obstante, no se trata de un sistema cartesiano, 
y tareas como la medición de áreas o distancias es mucho más complicada. Si bien 
la distancia entre dos paralelos es prácticamente constante (es decir, un grado 
de latitud equivale más o menos a una misma distancia en todos los puntos), la 
distancia entre dos meridianos no lo es, y varía entre unos 11,3 kilómetros en el 
Ecuador hasta los cero kilómetros en los polos, donde los meridianos convergen. 

3.3.2. Proyecciones cartográficas 

A pesar de su innegable utilidad y la potencia que nos brindan para la locali- 
zación de cualquier punto sobre la superficie terrestre, un sistema de coordenadas 
esféricas tiene inconvenientes que no pueden obviarse. Por una parte, estamos más 
acostumbrados a la utilización de sistemas cartesianos en los cuales la posición 
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Ciudad 

Latitud 

Longitud 

Badajoz 

38.53 N 

6.58 0 

Barcelona 

41.23 N 

2.11 E 

Cádiz 

36.32 N 

6.18 0 

Girona 

41.59 N 

2.49 E 

Granada 

37.11 N 

3.35 0 

Madrid 

40.24 N 

3.41 0 

Segovia 

40.57 N 

4.07 0 

Valencia 

39.28 N 

0.22 0 

Zaragoza 

41.39 N 

0.52 O 


Cuadro 3.2: Coordenadas geográficas de algunas ciudades 


de un punto se define mediante un par de medidas de distancia x e y. Esta forma 
es mucho más sencilla e intuitiva, y permite una mayor facilidad de operaciones. 

Por otro lado, si necesitamos crear una representación visual de la información 
cartográfica, lo habitual es hacerlo en una superficie plana, ya sea a la manera 
clásica en un pliego de papel o, usando las tecnologías actuales, en un dispositivo 
tal como una pantalla. 

Por todo ello, se deduce que existe una necesidad de poder trasladar la infor- 
mación geográfica (incluyendo, por supuesto, la referente a su localización) a un 
plano, con objeto de poder crear cartografía y simplificar gran número de opera- 
ciones posteriores. El proceso de asignar una coordenada plana a cada punto de 
la superficie de la Tierra (que no es plana) se conoce como proyección cartográfica. 

Más exactamente, una proyección cartográfica es la correspondencia matemá- 
tica biunívoca entre los puntos de una esfera o elipsoide y sus transformados en un 
plano [23]. Es decir, una aplicación / que a cada par de coordenadas geográficas 
(Ó, A) le hace corresponder un par de coordenadas cartesianas (x,y), según 

z = /(<M);i/ = /(ó, A) (3.3.1) 

De igual modo, las coordenadas geográficas puede obtenerse a partir de las 
cartesianas según 


4>=g{x,y)- 1 X = g{x,y) (3.3.2) 

Se puede pensar que podemos obtener una representación plana de la superficie 
de una esfera o un elipsoide si tomamos esta y la extendemos hasta dejarla plana. 
Esto, sin embargo, no resulta posible, ya que dicha superficie no puede desarrollarse 
y quedar plana. Por ello, hay que buscar una forma distinta de relacionar los puntos 
en la superficie tridimensional con nuevos puntos en un plano. 


Fundamentos cartográficos y geodésicos 


49 


Superficie plana 



Figura 3.5: Esquema del concepto de proyección. A los puntos A,B y C sobre la superficie 
del elipsoide les asocian equivalentes a,b y c sobre un plano. 


La figura 3.5 muestra un esquema del concepto de proyección, esbozando la idea 
de cómo puede establecerse la correspondencia entre puntos de la esfera y del plano. 

En ella vemos cómo el concepto de proyección se asemeja a la generación de som- 
bras, ya que a partir de un foco se trazan las trayectorias de una serie de rayos que 
unen dicho foco con los puntos a proyectar, y después se determina el punto de con- 
tacto de esos rayos con la superficie plana. Aunque no todas las proyecciones siguen 
necesariamente este esquema, una parte de ellas sí que se fundamentan en un razo- 
namiento similar a este, y el esquema mostrado sirve bien para entender el concepto 
y el paso de coordenadas de una superficie tridimensional a una bidimensional. 

Veremos en los siguientes puntos las diferentes modificaciones que pueden 
introducirse sobre la forma anterior de proyectar, y que dan lugar a tipos distintos 
de proyecciones. 

Puede apreciarse igualmente en la figura que se producen distorsiones al realizar 
la proyección. Es decir, que ciertas propiedades no se reproducen con fidelidad al 
pasar puntos desde la superficie curva al plano. Por ejemplo, la distancia entre los 
puntos A y B no es igual a la existente entre los puntos ay b. Con independencia 
de las características propias de la proyección, siempre existen distorsiones. Esto 
es así debido a que la esfera, como se ha dicho, no es desarrollable, mientras que el 
plano sí lo es, y por ello en el paso de coordenadas de uno a otra han de aparecen 
inevitablemente alteraciones. 

Tipos de proyecciones 

Las proyecciones se clasifican según la superficie sobre la que se proyectan 
los puntos. En el esquema de la figura 3.5, el plano de proyección es ya de por sí 
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Figura 3.6: Esquema de una proyección cilindrica (tomado de Wikipedia) 


bidimensional. No obstante, puede realizarse la proyección sobre una superficie 
tridimensional, siempre que esta, a diferencia de la esfera, sí sea desarrollable. 
Es decir, que pueda «desenrollarse» y convertirse en un plano sin necesidad de 
doblarse o cortarse. Estas otras superficies pueden emplearse también para definir 
una proyección, de la misma forma que se hace con un plano. 

Las superficies más habituales son el cono y el cilindro (junto con, por supuesto, 
el plano), las cuales, situadas en una posición dada en relación al objeto a proyectar 
(esto es, la Tierra), definen un tipo dado de proyección. Distinguimos así los 
siguiente tipos de proyecciones: 

■ Cónicas. La superficie desarrollable es un cono (Figura 3.7), que se sitúa 
generalmente tangente o secante en dos paralelos a la superficie del elipsoide. 
En este último caso, la distorsión se minimiza en las áreas entre dichos 
paralelos, haciéndola útil para representar franjas que no abarquen una gran 
distancia en latitud, pero poco adecuada para representación de grandes áreas. 
Algunas de las proyecciones más conocidas de este grupo son la proyección 
cónica equiárea de Albers y la proyección conforme cónica de Lambert. 

■ Cilindricas. La superficie desarrollable es un cilindro (Figura 3.6). Al pro- 
yectar, los meridianos se convierten en lineas paralelas, así como los paralelos, 
aunque la distancia entre estos últimos no es constante. 

En su concepción más simple, el cilindro se sitúa de forma tangente al ecuador 
(proyección normal o simple), aunque puede situarse secante y hacerlo a los 
meridianos (proyección transversa) o a otros puntos (proyección oblicua) . 
La proyección de Mercator, la transversa de Mercator, la cilindrica de Miller 
o la cilindrica equiárea de Lambert son ejemplos relativamente comunes de 
este tipo de proyecciones. 

■ Planas o azimutales. La superficie desarrollable es directamente un plano. 
Según el esquema de la figura 3.5, tenemos distintos tipos en función de la 
posición del punto de fuga. 
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Figura 3.7: Esquema de una proyección cónica (tomado de Wikipedia) 


• Gnómica o central. El punto de fuga se sitúa en el centro del elipsoide. 

• Estereográfica. El plano es tangente y el punto de fuga se sitúa en las 
antípodas del punto de tangencia. La proyección polar estereográfica 
es empleada habitualmente para cartografiar las regiones polares. 

• Ortográfica. El punto de fuga se sitúa en el infinito. 

Existen proyecciones azimutales que no son de tipo perspectivo, es decir, 
que no se basan en el esquema de la figura 3.5. La proyección de Airy, por 
ejemplo, es una de ellas. 

■ Algunas proyecciones no se ajustan exactamente al esquema plantea- 
do, y no utilizan una superficie desarrollable como tal sino modificaciones a 
esta idea. Por ejemplo, las proyecciones policónicas utilizan la misma filosofía 
que las cónicas, empleando conos, pero en lugar de ser este único, se usan 
varios conos, cada uno de los cuales se aplica a una franja concreta de la zona 
proyectada. La unión de todas esas franjas, cada una de ellas proyectada 
de forma distinta (aunque siempre con una proyección cónica), forma el 
resultado de la proyección. 

Del mismo modo, encontramos proyecciones como la proyección sinusoidal, 
una proyección de tipo pseudocilíndrico, o la proyección de Werner, cuya 
superficie desarrollable tiene forma de corazón. Estas proyecciones son, no 
obstante, de uso menos habitual, y surgen en algunos casos como respuesta 
a una necesidad cartográfica concreta. 

Otra forma distinta de clasificar las proyecciones es según las propiedades 
métricas que conserven. Toda proyección implica alguna distorsión (denominada 
anamorfosis ) , y según cómo sea esta y a qué propiedad métrica afecte o no, podemos 
definir los siguientes tipos de proyecciones: 

■ Equiárea. En este tipo de proyecciones se mantiene una escala constan- 
te. Es decir, la relación entre un área terrestre y el área proyectada es la 
misma independientemente de la localización, con lo que la representación 
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proyectada puede emplearse para comparar superficies. 

■ Conformes. Estas proyecciones mantienen la forma de los objetos, ya que 
no provocan distorsión de los ángulos. Los meridianos y los paralelos se 
cortan en la proyección en ángulo recto, igual que sucede en la realidad. Su 
principal desventaja es que introducen una gran distorsión en el tamaño, y 
objetos que aparecen proyectados con un tamaño mucho mayor que otros 
pueden ser en la realidad mucho menores que estos. 

■ Equidistantes. En estas proyecciones se mantienen las distancias. 

En los ejemplos de proyecciones que se han citado para los distintos tipos de 
proyecciones (cónicas, cilindricas, etc.) puede verse cómo resulta común especi- 
ficar el tipo en función de la propiedad métrica preservada, para así caracterizar 
completamente la proyección. 

La elección de una u otra proyección es función de las necesidades particulares. 
Como ya se ha dicho, la proyección polar estereográfica es empleada cuando se 
trabaja las regiones polares, ya que en este caso es la más adecuada. Proyecciones 
como la de Mercator, empleadas habitualmente, no resultan tan adecuadas en 
esas zonas. Asimismo, hay proyecciones que no pueden recoger todo el globo, sino 
solo una parte de este, por lo que no son de aplicación para grandes escalas. La 
existencia de un gran número de distintas proyecciones es precisamente fruto de 
las diferentes necesidades que aparecen a la hora de trabajar con cartografía. 


3.3.3. El sistema UTM 

De entre los cientos proyecciones de existen actualmente, algunas tienen un 
uso más extendido, bien sea por su adopción de forma estandarizada o sus propias 
características. Estas proyecciones, que se emplean con más frecuencia para la 
creación de cartografía, son también las que más habitualmente vamos a encontrar 
en los datos que empleemos con un SIG, y es por tanto de interés conocerlas un 
poco más en detalle. 

En la actualidad, una de las proyecciones más extendidas en todos los ámbitos es 
la proyección universal transversa de Mercator, la cual da lugar al sistema de coorde- 
nadas UTM. Este sistema, desarrollado por el ejército de los Estados Unidos, no es 
simplemente una proyección, sino que se trata de un sistema completo para cartogra- 
fiar la practica totalidad de la Tierra. Para ello, esta se divide en una serie de zonas 
rectangulares mediante una cuadricula y se aplica una proyección y unos parámetros 
geodésicos concretos a cada una de dichas zonas. Aunque en la actualidad se emplea 
un único elipsoide (WGS-84), originalmente este no era único para todas las zonas. 

Con el sistema UTM, las coordenadas de un punto no se expresan como coorde- 
nadas terrestres absolutas, sino mediante la zona correspondiente y las coordenadas 
relativas a la zona UTM en la que nos encontremos. 

La cuadricula UTM tiene un total de 60 husos numerados entre 1 y 60, cada 
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Figura 3.8: Representación parcial de la cuadrícula UTM en Europa (tomado de 
Wikipedia) 


uno de los cuales abarca una amplitud de 6°de longitud. El huso 1 se sitúa entre 
los 180°y 174°0, y la numeración avanza hacia el Este. 

En latitud, cada huso se divide en 20 zonas, que van desde los 80°S hasta los 
84°N. Estas se codifican con letras desde la C a la X, no utilizándose las letras I 
y O por su similitud con los dígitos 1 y 0. Cada zona abarca 8 grados de longitud, 
excepto la X que se prolonga unos 4 grados adicionales. 

La figura 3.8 muestra un esquema de la cuadrícula UTM. 

Una zona UTM se localiza, por tanto, con un número y una letra, y es en 
función de la zona como posteriormente se dan las coordenadas que localizan un 
punto. Estas coordenadas se expresan en metros y expresan la distancia entre el 
punto y el origen de la zona UTM en concreto. El origen de la zona se sitúa en 
el punto de corte entre el meridiano central de la zona y el ecuador. Por ejemplo, 
para las zonas UTM en el huso 31, el cual va desde los 0°hasta los 6 o , el origen 
se sitúa en el punto de corte entre el ecuador y el meridiano de 3 o (Figura 3.9). 

Para evitar la aparición de números negativos, se considera que el origen no 
tiene una coordenada X de 0 metros, sino de 500000. Con ello se evita que las 
zonas al Este del meridiano central tengan coordenadas negativas, ya que ninguna 
zona tiene un ancho mayor de 1000000 metros (el ancho es máximo en las zonas 
cerca del ecuador, siendo de alrededor de 668 kilómetros). 

De igual modo, cuando se trabaja en el hemisferio sur (donde las coordenadas 
Y serían siempre negativas) , se considera que el origen tiene una coordenada Y de 
10000000 metros, lo cual hace que todas las coordenadas referidas a él sean positivas. 

Para las zonas polares no resulta adecuado emplear el sistema UTM, ya que las 
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Figura 3.9: Determinación del origen de una zona UTM 


distorsiones que produce son demasiado grandes. En su lugar, se utiliza el sistema 
UPS (Universal Polar Stereographic). 

3.3.4. Transformación y conversión de coordenadas 

Una situación muy habitual en el trabajo con un SIG es disponer de cartografía 
en varios sistemas de coordenadas en un mismo sistema pero con parámetros 
diferentes (por ejemplo, diferente datum). Para poder emplear toda esa cartografía 
de forma conjunta, resulta necesario trabajar en un sistema único y bien definido, 
lo cual hace necesario convertir al menos una parte de ella. 

Este cambio de coordenadas puede ser obligatorio a cualquier escala de trabajo, 
ya que las diferencias en el sistema escogido pueden aparecer por circunstancias 
muy diversas, incluso si todos los datos tienen un origen común. Así, al reunir 
información de varios países para crear en un SIG un mapa de todo un continente, 
es probable que los datos de cada país estén referidos a un sistema distinto, pero 
incluso trabajando en un área más reducida podemos encontrar una situación 
similar. En España, por ejemplo, podemos encontrar cartografía de algunas Co- 
munidades Autónomas en dos husos UTM distintos, ya que la frontera entre estos 
cruza y divide dichas Comunidades. 

Distinguimos dos tipos de operaciones a realizar con coordenadas: 

■ Conversión de coordenadas. Los sistemas de origen y destino comparten 
el mismo datum. Es una transformación exacta y se basa en la aplicación 
de formulas establecidas que relacionan ambos sistemas. 

■ Transformación de coordenadas. El datum es distinto en los sistemas 
de origen y destino. 

Las proyecciones cartográficas, vistas en un punto anterior, son una forma 
particular de conversión de coordenadas. 

Un SIG ha de estar preparado para trabajar con cartografía en cualquiera de 


Fundamentos cartográficos y geodésicos 


55 


los sistemas de referencia más habituales y, más aún, para facilitar al usuario la 
utilización de todo tipo de información geográfica con independencia del sistema 
de coordenadas que se emplee. Para ello, los SIG incorporan los procesos necesarios 
para efectuar cambios de coordenadas, de forma que para unos datos de partida 
se genera un nuevo conjunto de datos con la misma información pero expresada 
en un sistema de coordenadas distinto. 

Otra forma en la que los SIG pueden implementar estas operaciones es mediante 
capacidades de transformación y conversión «al vuelo», es decir, en tiempo real. 
De este modo, pueden introducirse en un SIG datos en sistemas de coordenadas 
variados, y el SIG se encarga de cambiar estos a un sistema de referencia base 
fijado de antemano. Este proceso tiene lugar de forma transparente para el usuario, 
que tiene la sensación de que todos los datos estaban originalmente en el sistema 
de trabajo escogido. 

Esto exige, lógicamente, que todo dato geográfico se acompañe de información 
acerca del sistema de coordenadas que se ha utilizado para crearlo, algo que no 
siempre sucede. Veremos más acerca de la importancia de este tipo de información 
adicional en el capítulo 31. 

3.3.5. Codificación de sistemas de referencia 

Debido al elevado número de distintos sistemas de referencia existentes, resulta 
fácil perderse en ellos a la hora de tener que trabajar con cartografía en distintos 
sistemas. Si bien es cierto que existe un esfuerzo integrador para tratar de horno- 
geneizar el uso de sistemas de referencia, también existen esfuerzos para intentar 
facilitar la gestión de estos y que no resulte tan complejo combinar cartografía 
producida utilizando sistemas de coordenadas diferentes. 

Uno de los intentos más exitosos en este sentido es el desarrollado por el con- 
sorcio petrolífero European Petroleum Survey Group (EPSG), el cual, consciente 
de la necesidad de disponer de información acerca de los distintos sistemas de 
coordenadas y de que esta información fuera de fácil acceso y manejo, ha elaborado 
un esquema de codificación específico. 

Este esquema asocia a cada sistema de coordenadas un código (conocido co- 
mo código EPSG ) que la identifica. Paralelamente, se han documentado en un 
formato común las características principales de todos estos sistemas, así como 
las formulaciones que permiten transformar coordenadas entre ellos. 

Esta información constituye el EPSG geodetic parameter dataset [24], un 
repositorio de los parámetros necesarios para 

■ identificar coordenadas de tal modo que estas describan la posición de un 
punto de forma inequívoca y no ambigua. 

■ definir transformaciones y conversiones que permitan pasar de un sistema 
de referencia a otro. 

Información detallada sobre los códigos EPSG puede encontrarse en [24] . 
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3.4. Escala 

El concepto de escala es fundamental a la hora de trabajar con cartografía, y 
es uno de los valores básicos que definen toda representación cartográfica. Esta 
representación ha de tener un tamaño final manejable, con objeto de que pueda 
resultar de utilidad y permitir un uso práctico, pero el objeto que se cartografía 
(un país, un continente o bien la Tierra al completo) es un objeto de gran tamaño. 
Esto hace necesario que, para crear un mapa, se deba reducir o bien el objeto 
original o bien el objeto ya proyectado, dando lugar a una versión «reducida» que 
ya cumple con los requisitos de tamaño adecuado. 

Es decir, imaginemos que aplicamos una proyección cónica sobre el elipsoide, 
empleando para ello un cono que cubra dicho elipsoide, el cual tendrá que ser, 
lógicamente de gran tamaño (¡hay que cubrir toda la Tierra!). Al desarrollarlo, 
el plano que obtenemos tiene miles de kilómetros de lado. Debemos fabricar una 
versión «a escala» de este, que será la que ya podamos utilizar. 

En este contexto, la escala no es sino la relación de tamaño existente entre 
ese gran mapa que se obtiene al desarrollar nuestro cono de proyección y el que 
finalmente manejamos, de tamaño más reducido. Conociendo esta relación po- 
demos ya conocer las verdaderas magnitudes de los elementos que vemos en el 
mapa, ya que podemos convertir las medidas hechas sobre el mapa en medidas 
reales. Es importante recordar que esas medidas no son tan «reales», puesto que 
la propia proyección las ha distorsionado — lo cual no debe olvidarse — , pero sí 
que son medidas en la escala original del objeto cartografiado. 

La escala se expresa habitualmente como un denominador que relaciona una 
distancia medida en un mapa y la distancia que esta medida representa en la 
realidad. Por ejemplo, una escala 1:50000 quiere decir que 1 centímetro en un mapa 
equivale a 50000 centímetros en la realidad, es decir a 500 metros. Conociendo este 
valor de la escala podemos aplicar sencillas reglas de tres para calcular la distancia 
entre dos puntos o la longitud de un elemento dado, sin más que medirlo sobre 
el mapa y después convertir el resultado obtenido en una medida real. 

Una vez más es preciso insistir que lo anterior es posible siempre bajo las limi- 
taciones que la propia proyección empleada para crear el mapa tenga al respecto, 
y que dependerán del tipo de proyección que sea en función de las propiedades 
métricas que conserva. 

De hecho, e independientemente del tipo de proyección, la escala es comple- 
tamente cierta únicamente en determinadas partes del mapa. Cuando decimos 
que un mapa tiene una escala 1:50000, este valor, denominado Escala Numérica , 
se cumple con exactitud tan solo en algunos puntos o líneas. En otros puntos la 
escala varía. La relación entre la escala en esos puntos y la Escala Numérica se 
conoce como Factor de Escala. 

A pesar de que la escala es imprescindible para darle un uso práctico a todo 
mapa, y cualquier usuario de este debe conocer y aplicar el concepto de escala de 
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forma precisa, los SIG pueden resultar engañosos al respecto. Aunque la escala 
como idea sigue siendo igual de fundamental cuando trabajamos con información 
geográfica en un SIG, las propias características de este y la forma en la que dicha 
información se incorpora en el SIG pueden hacer que no se perciba la escala como 
un concepto tan relevante a la hora de desarrollar actividad con él. 

Esto es debido principalmente a que la escala tiene una relación directa con 
la visualización, ya que se establece entre la realidad y una representación visual 
particular, esto es, el mapa. Como ya se ha mencionado en el capítulo 1, los datos en 
un SIG tienen carácter numérico y no visual, y la representación de estos se encarga 
de realizarla el subsistema correspondiente a partir de dichos datos numéricos. Es 
decir, que en cierta medida en un SIG no es estrictamente necesaria la visualización 
de los datos, y cuando esta se lleva a cabo no tiene unas características fijas, ya 
que, como veremos, el usuario puede elegir el tamaño con el que estos datos se 
representan en la pantalla. 

Un mapa impreso puede ampliarse o reducirse mediante medios fotomecánicos. 
Sin embargo, no es esta una operación «natural», y está claro que desde el punto 
de vista del rigor cartográfico no es correcta si lo que se hace es aumentar el tamaño 
del mapa. En un SIG, sin embargo, es una operación más el elegir la escala a la que 
se representan los datos y modificar el tamaño de representación, y esta resulta 
por completo natural e incluso trivial[25]. 

Pese a ello, los datos tienen una escala inherente, ya que esta no está en función 
de la representación, sino del detalle con que han sido tomados los datos, y esta 
escala debe igualmente conocerse para dar un uso adecuado a dichos datos. En 
este sentido es más conveniente entender la escala como un elemento relacionado 
con la resolución de los datos, es decir, con el tamaño mínimo cartografiado. 

Esta concepción no es en absoluto propia de los SIG, ya que deriva de las 
representaciones clásicas y los mapas impresos. Se sabe que el tamaño mínimo que 
el ojo humano es capaz de diferenciar es del orden de 0,2 mm. Aplicando a este 
valor la escala a la que queremos crear un mapa, tendremos la mínima distancia 
sobre el terreno que debe medirse. Por ejemplo, para el caso de un mapa 1:50000, 
tenemos que la mínima distancia es de 10 metros 

Si medimos puntos a una distancia menor que la anterior y después los repre- 
sentamos en un mapa a escala 1:50000, esos puntos no serán distinguibles para 
el usuario de ese mapa, y la información recogida se perderá. Estos razonamientos 
sirven para calcular la intensidad del trabajo que ha de realizarse para tomar los 
datos con los que después elaborar una determinada cartografía. 

En realidad, el concepto de escala no es único, sino que tiene múltiples facetas. 
Por una parte la escala cartográfica , que es la mera relación entre el tamaño en 
el mapa y la realidad. Por otra, la escala de análisis u operacional [26], que es la 
que define la utilidad de los datos y lo que podemos hacer con ellos, ya que indica 
las limitaciones de estos. Cuando en un SIG aumentamos el tamaño en pantalla 
de una cierta información geográfica, estamos variando la escala cartográfica, pero 


58 


Sistemas de Información Geográfica 


no estamos modificando la escala de análisis. Por ello, por mucho que ampliemos 
no vamos a ver más detalles, ya que para ello sería necesario tomar más datos. 

Veremos más ideas sobre la escala de análisis y algunas implicaciones al respecto 
en el capítulo 9, al inicio de la parte dedicada a los procesos, ya que estos conceptos 
son fundamentales para realizar correctamente análisis y operaciones como las 
descritas en esa parte del libro. 

Un tipo de datos espaciales particulares con los que se trabaja en un SIG, los 
datos ráster, tienen a su vez un parámetro de resolución, con una clara relación 
con el concepto de escala. Veremos más al respecto en el capítulo 5. 


3.5. Generalización cartográfica 

Muy relacionado con el concepto de escala encontramos la denominada gene- 
ralización cartográfica. Generalizar implicar expresar alguna idea o información de 
forma más resumida, de tal modo que esta sea comprensible y pueda aprovecharse 
de la mejor manera posible. Cuando hablamos de cartografía, la generalización 
implica representar un dato geográfico a una escala menor (es decir, un tamaño 
mayor) del que le corresponde si se atiende al detalle que este posee. 

Si resulta incorrecto como hemos visto ampliar el tamaño un mapa sin in- 
corporar más datos (esto es, sin variar consecuentemente la escala de análisis), 
puede resultar igualmente erróneo «encoger» ese mapa y mostrar la información 
geográfica a una escala muy distinta de la que corresponde a esos datos. Si la 
diferencia de escala es pequeña, no existe dificultad, pero si esta diferencia es 
grande, la representación resultante puede no ser adecuada y confusa. No solo 
habrá información que no se perciba, sino que parte de la información que quede 
patente puede no estarlo en la forma idónea y más intuitiva. 

Para ver un ejemplo de lo anterior, y poniendo un ejemplo un tanto extremo, 
pensemos en un mapa del mundo en el que se representen todas las calles y caminos 
existentes. Esta información tiene una escala adecuada para ser mostrada en un 
callejero local cuya escala nominal suele ser del orden de 1:5000, pero a la escala 
1:1000000, adecuada para un mapa mundial, representar todo su detalle resulta 
innecesario. La representación resultante va a tener una densidad excesiva, y 
muchos de sus elementos no podrán distinguirse debido a su cercanía. 

En caso de que esta representación no se haga sobre papel sino sobre una pantalla 
y trabajando con un SIG, la situación es similar y resulta incluso más necesario 
aplicar alguna forma de generalización. A las limitaciones de la visión humana han 
de sumarse las limitaciones de resolución que el propio dispositivo presenta. En la 
situación del ejemplo anterior, muchos elementos del mapa (calles, edificios, etc.), 
ocuparían por su tamaño un mismo y único punto en la pantalla (veremos más 
adelante que cada uno de estos puntos se conoce como píxel), por lo que resultaría 
imposible distinguirlos o detallarlos más allá de ese nivel de resolución. 
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A lo anterior debemos añadir el hecho de que producir esa representación, 
aunque sea sobre un solo píxel, puede requerir gran cantidad de procesos y ope- 
raciones, ya que el conjunto de calles que se contienen en él pueden presentar gran 
complejidad, tanto mayor cuanto mayor sea el nivel de detalle con que han sido 
recogidas en los datos. Es decir, que en el trabajo con un SIG la generalización 
no tiene importancia únicamente para la visualización en sí, sino también para 
el rendimiento del propio SIG a la hora de producir dicha visualización. 

Aunque en las situaciones anteriores la generalización puede llevarse a cabo 
eligiendo qué elementos representar y cuáles no, esta selección no recoge en sí toda 
la complejidad de la generalización, ya que esta es un conjunto más complejo de 
procesos y transformaciones gráficas [27] . 

En ocasiones, el proceso de generalización es necesario por razones distintas 
a lo visto en el ejemplo anterior, y requiere diferentes operaciones. Por ejemplo, 
podemos crear un mapa del mundo que contenga vías de comunicación, pero no 
todas, sino solo las principales autopistas de cada país. En este caso, no vamos 
a encontrar problemas con distintas carreteras que se solapan en la representación, 
ni tampoco un volumen excesivo de datos, pero debemos igualmente «adaptar» 
la representación a la escala, es decir, efectuar algún tipo de generalización. 

Si en ese mapa representamos una carretera con un ancho de 20 metros a escala 
1:1000000, el tamaño que tendrá en el mapa será de tan solo 0,02 milímetros. Este 
ancho es prácticamente nulo y no tiene sentido representar esa carretera de esta 
forma, sino darle un ancho mayor. Aunque no se esté dibujando con exactitud 
la magnitud real de ese elemento, el resultado es mucho mejor desde todos los 
puntos de vista. Esta es otra forma de generalización que busca también mejorar 
la calidad de la representación y la transmisión de la información que contiene. 

La generalización, por tanto, es un proceso que tiene como objetivo la pro- 
ducción de una imagen cartográfica legible y expresiva, reduciendo el contenido 
del mapa a aquello que sea posible y necesario representar. Para ello, se enfatiza 
aquello que resulta de importancia y se suprime lo que carece de ella [28]. 

3.5.1. Operaciones de generalización 

Existen diversas operaciones que se emplean en el proceso de generalización. 
Algunas de las más relevantes son las siguientes [29] : 

■ Simplificación. Se trata de crear elementos más sencillos que sean más 
fáciles y rápidos de representar. Los elementos originales se sustituyen por 
estos más sencillos, de tal modo que se mantienen las características visuales 
principales pero las operaciones con los datos se optimizan. 

■ Suavizado. Se sustituyen formas angulosas por otras más suaves y de menor 
complejidad. 

■ Agregación. Un conjunto de varios objetos se sustituye por uno nuevo con un 
menor número. Por ejemplo, al representar una ciudad, no dibujar cada una 
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Figura 3.10: Un ejemplo de generalización por agregación. Dos carreteras prácticamente 
paralelas y unidas se representan como dos elementos en el mapa, pero en el localizador 
de la parte superior izquierda, a escala de menor detalle, se generalizan como una única 
(Tomado de Yahoo Maps) . 


de las casas, sino solo el contorno de cada manzana. La figura 3.10 muestra un 
ejemplo de esta técnica aplicado a elementos lineales, en particular carreteras. 

■ Exageración. En ocasiones, mantener el objeto a la escala que le corres- 
ponde haría que no se pudieran apreciar las características de este. En este 
caso, se exagera su tamaño para que pueda interpretarse con mayor facilidad 
y no perder información en la representación. 

■ Desplazamiento. Un objeto se representa en una posición distinta a la que 
le corresponde, con el fin de garantizar su visibilidad y obtener un resultado 
más claro. 

Combinando operaciones como las anteriores de forma adecuada, se obtiene 
una cartografía mucho más útil, en la cual la información que contiene resulta más 
accesible y práctica, con un mayor potencial desde todos los puntos de vista. En 
el caso de trabajar en un SIG, algunas de estas operaciones, como pueden ser la 
simplificación o la agregación, tiene también un efecto beneficioso sobre el propio 
manejo de los datos dentro del SIG. 

Estas operaciones se enumeran aquí como ideas a aplicar para efectuar la 
generalización de un documento geográfico, como corresponde a este capítulo 
de fundamentos y conceptos cartográficos básicos. No obstante, estas mismas 
operaciones también las veremos en otras partes del libro, ya que no son exclusivas 
de esta parte. Por su importante papel en la representación visual de los datos, 
veremos más al respecto en la parte dedicada a visualización. Algunos algoritmos 
para la simplificación y suavizado de líneas los estudiaremos en la parte dedicada 
a procesos, particularmente en el apartado 18.7. 
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3.5.2. Generalización en el contexto de un SIG 

La generalización es importante en un SIG debido a la variedad de escalas 
posibles que puede tener la información con que se trabaja, así como por la variedad 
de escalas de representación que pueden definirse gracias a la flexibilidad que el 
propio SIG presenta en sus capacidades de visualización. Existen diversas formas 
de enfocar inicialmente el problema de obtener un juego de datos óptimo para ser 
representado en cada caso y una representación óptima de este. 

La mayor problemática se encuentra en el manejo de datos con gran preci- 
sión y gran volumen — como, por ejemplo, esos datos de calles y vías de todo el 
mundo — al representarlos a una escala de menor detalle, aunque el proceso de 
generalización no es necesario exclusivamente en este caso, sino en muchos otros 
con independencia del volumen y la escala original. 

Una aproximación básica puede ser trabajar con todo el conjunto de datos y 
generalizarlo a medida que sea necesario en función de la escala de trabajo en cada 
momento. Es decir, si el usuario decide visualizar todo un continente, el SIG no 
traza todas las calles de ese continente, sino que se seleccionan de forma automática 
los objetos a ser visualizados y después se crea la representación. Las operaciones de 
generalización se llevan a cabo en el momento mismo en que el usuario lo necesita. 

Este tipo de generalización «al vuelo» no resulta, sin embargo, óptimo, y en 
la mayoría de los casos es inviable o no proporciona los resultados esperados. Esto 
es así debido a que se ha de trabajar con el gran volumen de datos original, y 
generalizar estos es una tarea suficientemente compleja como para que los algo- 
ritmos encargados de hacerlo no lo hagan de forma fluida. No ha de olvidarse 
que, mientras que la razón fundamental de la generalización en el contexto de la 
cartografía clásica es la mera visualización y la transmisión de la información, en 
el entorno de un SIG también existen razones relacionadas con la eficiencia de los 
procesos, como ya se ha mencionado. Aplicando esta metodología, la generalización 
no es ventajosa en términos de cómputo, sino que, por el contrario, puede incluso 
suponer una carga adicional al proceso de visualización. 

Aun en el caso de que el volumen de datos no fuera grande y no existieran 
problemas de rendimiento, una generalización por completo automatizada no 
garantiza un resultado óptimo. Aun existiendo algoritmos y formulaciones mate- 
máticas que permiten generalizar de forma relativamente adecuada (algunos de los 
cuales los veremos más adelante en este libro) , el proceso global de generalización 
combina varios procedimientos distintos, y en conjunto conforma un proceso no 
exento de subjetividad. La labor tradicional del cartógrafo no puede automatizarse 
de forma total, y se hace necesario cierto trabajo manual para obtener un resultado 
de calidad o evaluar el generado por un procedimiento automático. 

Por todo lo anterior, la forma de incorporar la generalización dentro de un SIG 
suele basarse en un enfoque multi-escalar, en el cual se maneja información de una 
misma zona de estudio a diferentes escalas, y se usa en cada momento aquella que 
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resulte más conveniente. Si trabajara con cartografía en papel, sería equivalente 
a tener varios mapas de una zona a diferentes escalas. 

Por ejemplo, en un mapa con núcleos de población a escala 1:25000 se almacena- 
rá cada ciudad como un polígono que delimite su contorno. Esa misma información 
a escala 1:1000000 se almacenará como un único punto cada ciudad, ya que el 
tamaño de esta es demasiado pequeño en la representación, y no tiene sentido 
el empleo de tanto detalle. Para convertir un mapa en otro se ha producido un 
proceso de simplificación, convirtiendo polígonos en puntos. 

Si incorporamos ambos mapas dentro de un SIG, podemos utilizar el que 
corresponda en función de la escala requerida. De este modo, la generalización 
no es una tarea que el propio SIG desarrolle, sino que cuando esta es necesaria 
puede recurrir a una información ya generalizada de antemano. El rendimiento 
del proceso es mayor, y además el dato generalizado puede haber sido elaborado 
de la forma más conveniente. 

El concepto de capa, que veremos en el capítulo 4 y que es vital para la idea actual 
de un SIG, permite este manejo simultáneo de información a distintas escalas. 

En la figura 3.11 puede verse un esquema de lo anterior. A medida que variamos 
la escala de representación, la información que vemos representada tiene una escala 
distinta y podría también tener un distinto origen. Incluso el tipo de información 
que vemos varía, ya que las representaciones más globales son de tipo gráfico, 
creadas a partir de los propios datos almacenados como objetos (calles, carreteras, 
etc.), mientras que la de mayor detalle es una fotografía aérea. 

En el caso de imágenes tales como esa fotografía aérea, existen además en 
un SIG una serie de procesos que también pueden considerarse como parte de la 
generalización, y que atañen más al rendimiento que a la representación. Para 
entenderse esto piénsese que las imágenes se componen de elementos denominados 
píxeles, que son pequeños puntos, cada uno de los cuales tendrá un color asociado 
(esto lo veremos con mucho más detalle en el capítulo 5). El numero de estos píxeles 
en una imagen grande es muy superior al de una pantalla (una pantalla también 
se divide en puntos, si te acercas a una lo podrás ver claramente). 

El proceso de representación de la imagen en la pantalla consiste en calcular qué 
color asignar a cada píxel de la pantalla en función de los de la imagen, pero este 
proceso, si se utiliza la imagen completa, es muy costoso en términos de cómputo, 
ya que implica procesar toda la información de la imagen, que puede ser del orden 
de centenares de millones de píxeles. Si representamos una porción de esa imagen 
(una porción del territorio que cubre), podemos solo trabajar con los píxeles en 
esa zona, pero la representación de toda la imagen hace necesario procesar todos 
los valores que contiene. 

Este proceso en realidad puede verse como un tipo de generalización «al vue- 
lo». Ya dijimos que este tenía principalmente dos problemas: el rendimiento y la 
imposibilidad de obtener resultados óptimos de forma automatizada. En el caso de 
imágenes, existe el problema del rendimiento, pero es posible automatizar la crea- 
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Figura 3.11: En un SIG es habitual manejar información a diferentes escalas. En función 
de la escala de representación, la información visualizada será una u otra. 



Figura 3.12: Pirámides de representación con imágenes preparadas a distintas escalas 
(Fuente: OSGeo). 


ción de datos a diferente escala de trabajo. Esto es así debido a que la representación 
de elementos tales como carreteras o lagos se hace mediante una interpretación de 
esos objetos, y este proceso es en cierta medida subjetivo, como vimos. En el caso 
de imágenes no hay que interpretar objeto alguno, ya que esos objetos ya «están» 
representados en la imagen, y únicamente es necesario disminuir la escala. 

Los algoritmos para llevar a cabo este proceso se conocen como de remuestreo, 
y los veremos con detalle en el capítulo 14. Algunos SIG utilizan estos algoritmos 




para hacer más fluido el manejo de grandes imágenes mediante la creación de las 
denominadas pirámides. Cuando el usuario introduce en el SIG una imagen de gran 
tamaño, este prepara varias versiones de esa imagen a distintas escalas de detalle, 
de forma que posteriormente pueda recurrir a la que sea más conveniente en cada 
caso en función de la escala de representación. Es decir, el SIG realiza la «gene- 
ralización» de esa imagen de forma automática, siendo necesario proporcionarle 
únicamente la imagen de mayor detalle. La figura 3.12 ilustra gráficamente esto. 

3.6. Resumen 

La cartografía y la geodesia son ciencias que aportan un importante conjunto 
de conocimientos y elementos al mundo de los SIG, y su estudio es fundamental 
para cualquier trabajo con un SIG. 

La geodesia se encarga de estudiar la forma de la Tierra, con objeto de posterior- 
mente poder localizar de forma precisa los puntos sobre esta mediante un sistema 
de coordenadas. Dos conceptos básicos en geodesia son el geoide y el elipsoide , 
superficies de referencia que modelizan la forma de la Tierra. El primero es la 
superficie formada por los puntos en los que el campo gravitatorio tiene una misma 
intensidad, y se obtiene prolongando la superficie de los océanos en reposo bajo 
la superficie terrestre. El segundo es un objeto definido por una ecuación y una 
serie de parámetros, que permite asimilar la Tierra a una superficie matemática. 

El conjunto de un elipsoide y un punto de tangencia con la superficie terrestre 
(Punto Fundamental), forma un datum. 

Para asignar coordenadas a un punto en función de los elementos anteriores 
es necesario definir un sistema de referencia. Las coordenadas geográficas han sido 
utilizadas tradicionalmente, y son de utilidad para grandes zonas. Otro tipo de 
coordenadas más intuitivas son las cartesianas, y para su obtención se requiere 
el concurso de una proyección cartográfica que convierta coordenadas espaciales 
en coordenadas planas. Hay muchos tipos de proyecciones, siendo el sistema UTM 
uno de los más extendidos. 

En el ámbito de la cartografía, hemos visto en este capítulo la importancia del 
concepto de escala, que no pierde su papel fundamental al trabajar en un SIG en 
lugar de hacerlo con cartografía impresa. Estrechamente relacionada con la escala 
encontramos la generalización, que comprende una serie de procesos encaminados 
a la obtención de una representación lo más clara posible de una serie de datos 
a una escala dada. 


Parte II 
Los datos 




Capítulo 4 


Introducción. ¿Con qué trabajo en un SIG? 


Los datos son el elementos clave de un SIG, pues sin ellos el resto de componentes no 
tienen utilidad alguna. La preparación de un adecuado conjunto de datos es base para poder 
llevar adelante con garantías todo proyecto SIG. En este capítulo veremos las características 
fundamentales de los datos y de la información espacial, presentando los conceptos básicos 
de estos que deben tenerse siempre presentes a la hora de trabajar con un SIG 


4.1. Introducción 

De todos los subsistemas de SIG, el correspondiente a los datos es el pilar 
fundamental que pone en marcha los restantes. Los datos son el combustible que 
alimenta a los restantes subsistemas, y sin los cuales un SIG carece por completo 
de sentido y utilidad. 

El subsistema de datos es, a su vez, el más interrelacionado, y está conectado de 
forma inseparable a todos los restantes. Mientras que, por ejemplo, la visualización 
no es por completo imprescindible para el desarrollo de procesos de análisis, no 
hay elemento del sistema SIG que pueda vivir si no es alimentado por datos. Los 
datos son necesarios para la visualización, para el análisis y para dar sentido a la 
tecnología y, en lo referente al factor organizativo y a las personas, el rol de estas 
en el sistema SIG es en gran medida gestionar esos datos y tratar de sacar de ellos 
el mayor provecho posible, buscando y extrayendo el valor que estos puedan tener 
en un determinado contexto de trabajo. Por tanto, los datos son fundamentales 
en un SIG, y todo esfuerzo dedicado a su estudio y a su mejor manejo será siempre 
positivo dentro de cualquier.trabajo con SIG. 

La forma en que los datos se gestionan en un SIG es un elemento vital para definir 
la propia naturaleza de este, así como sus prestaciones, limitaciones y características 
generales. En este capítulo introductorio veremos la diferencia entre los conceptos 
de datos e información, relacionados aunque distintos, y la forma en que ambos se in- 
corporan a un SIG. Esta concepción es importante, pues fundamenta la arquitectura 
interna que puede adoptar un SIG y las operaciones que se construyen sobre esta. 
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4.2. Datos vs Información 

Existe una importante diferencia entre los conceptos de datos e información. 
Ambos términos aparecen con frecuencia y pueden confundirse, pese a que repre- 
sentan cosas bien diferentes. Aun así, son conceptos muy unidos, y resultan clave 
para entender los fundamentos de un SIG tal y como estos se desarrollan a lo largo 
de este libro. Un SIG es un Sistema de Información Geográfica, pero maneja datos 
geográficos, existiendo diferencias entre estos conceptos. 

Entendemos como dato al simple conjunto de valores o elementos que utiliza- 
mos para representar algo. Por ejemplo, el código 502132N es un dato. Este código 
por sí mismo no tiene un significado, y es necesario interpretarlo para que surja ese 
significado. Al realizar esa interpretación, el dato nos informa del significado que 
tiene, y es en ese momento cuando podemos emplearlo para algún fin y llevar a cabo 
operaciones sobre él que tengan sentido y resulten coherentes con el significado 
propio que contiene. 

El dato anterior podemos interpretarlo como si fuera una referencia geográfica, 
y cuyo significado sería entonces una latitud, en particular 50°2l' 32" Norte. Si lo 
interpretamos como un código que hace referencia a un documento de identificación 
de una persona, la información que nos aporta es en ese caso completamente distin- 
ta. El dato sería el mismo, formado por seis dígitos y una letra, pero la información 
que da es diferente, ya que lo entendemos e interpretamos de manera distinta. 

La información es, por tanto, el resultado de un dato y una interpretación, y 
el trabajo con datos es en muchos casos un proceso enfocado a obtener de estos 
toda la información posible. Un dato puede esconder más información que la que 
a primera vista puede apreciarse, y es a través de la interpretación de los datos 
como se obtiene esta. 

En el capítulo 15 veremos cómo a partir de un Modelo Digital de Elevaciones 
podemos calcular parámetros tales como la pendiente, extraer el trazado de la 
red de drenaje o delimitar las subcuencas en que una cuenca vertiente mayor 
puede dividirse. El dato en este caso lo constituyen los valores que representan 
la elevación en los distintos puntos. La información que contienen está formada 
por todo ese conjunto de elementos que podemos obtener, desde la pendiente a los 
cursos de los ríos, pasando por todo aquello que mediante la aplicación de procesos 
u operaciones de análisis podamos extraer de esos datos. 

Comprender el significado y las diferencias entre datos e información permiten 
entender entre otras cosas que la relación entre los volúmenes de ambos no es necesa- 
riamente constante. Por ejemplo, los datos 502132NORTE o CINCUENTA VEIN- 
TIUNO TREINTAYDOS NORTE son mayores en volumen que 502132N, pero 
recogen la misma información espacial que este (suponiendo que los interpretamos 
como datos de latitud). Tenemos más datos, pero no más información. Podemos es- 
tablecer planteamientos basados en este hecho que nos ayuden a almacenar nuestra 
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información geográfica con un volumen de datos mejor, lo cual resulta ventajoso. Ve- 
remos algunos de estos planteamientos más adelante dentro de esta parte del libro. 

Aspectos como estos son realmente mucho más complejos, y el estudio de la 
relación entre datos e información y sus características no es en absoluto sencilla. 
Existe una disciplina, la ciencia de la información dedicada a estudiar los aspectos 
teóricos relativos a la información y la forma en que esta puede contenerse en los 
datos. El lector interesado puede consultar [30, 31] para saber más al respecto. 

En este capítulo de introducción a esta parte dedicada a los datos, veremos 
más acerca de la información que de los datos espaciales, pues la manera en que 
concebimos esta condiciona la forma de los datos. Será en el capítulo siguiente 
cuando tratemos ya los datos, abordando uno de los problemas fundamentales: 
la creación del dato espacial. 


4.3. Las componentes de la información geográfica 

Comprender la información geográfica es vital para poder capturar dicha 
información e incorporarla a un SIG. En líneas generales, podemos dividir esta en 
dos componentes principales, cada una de los cuales tiene su implicación particular 
en los procesos posteriores de representación que más adelante veremos. 

■ Componente espacial 

■ Componente temática 

La componente espacial hace referencia a la posición dentro de un sistema de 
referencia establecido. Esta componente es la que hace que la información pueda 
calificarse como geográfica, ya que sin ella no se tiene una localización, y por tanto el 
marco geográfico no existe. La componente espacial responde a la pregunta ¿ dónde ? 

Por su parte, la componente temática responde a la pregunta ¿qué? y va inva- 
riablemente unida a la anterior. En la localización establecida por la componente 
espacial, tiene lugar algún proceso o aparece algún fenómeno dado. La naturaleza 
de dicho fenómeno y sus características particulares, quedan establecidas por la 
componente temática. 

Puede entenderse lo anterior como una variable fundamental (la componente 
temática), que se sirve, sin embargo, de una variable soporte (la componente 
espacial) para completar su significado. 

Los tipos de división horizontal y vertical de la información que veremos más 
adelante implican una separación en unidades, que en la práctica puede implicar en 
un SIG que cada una de esas unidades quede almacenada en un lugar o fichero distin- 
to. En el caso de las componentes temática y espacial de la información, son posibles 
distintos enfoques, ya que estas pueden almacenarse de forma conjunta o bien por 
separado. El capitulo 8 trata estos enfoques, y en él veremos con detalle cómo puede 
abordarse el almacenamiento de ambas componentes de la mejor forma posible, 
así como la evolución que se ha seguido al respecto dentro del campo de los SIG. 
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Mientras que la componente espacial va a ser generalmente un valor numérico, 
pues son de esa naturaleza los sistemas de coordenadas que permiten expresar una 
posición concreta en referencia a un marco dado, la componente temática puede 
ser de distintos tipos: 

■ Numérica. A su vez, pueden señalarse los siguientes grupos: 

• Nominal. El valor numérico no representa sino una identificación. Por 
ejemplo, el número de un portal en una calle, o el numero del DNI de 
una persona. Este tipo de variable, al igual que la de tipo alfanumérico, 
es de tipo cualitativo, frente a las restantes que son de tipo cuantitativo. 

• Ordinal. El valor numérico establece un orden. Por ejemplo, una ca- 
pa en la que se recoja el año de fundación de las distintas ciudades 
contenidas en ella. 

• Intervalos. Las diferencias entre valores de la variable tienen un sig- 
nificado. Por ejemplo, entre dos valores de elevación. 

• Razones. Las razones entre valores de la variable tienen un significado. 
Por ejemplo, podemos decir que una precipitación media de lOOOmm es 
el doble que una de 500mm. La pertenencia de una variable a un grupo u 
otro no solo depende de la propia naturaleza de la misma, sino también 
del sistema en que se mida. Así, una temperatura en grados centígrados 
no se encuentra dentro de este grupo (pero sí en el de intervalos) , ya 
que la razón entre dichas temperaturas no vale para decir, por ejemplo, 
que una zona está al doble de temperatura que otra, mientras que si 
expresamos la variable temperatura en grados Kelvin sí que podemos 
realizar tales afirmaciones. El valor mínimo de la escala debe ser cero. 

■ Alfanumérica 

El tipo de variable condiciona las operaciones que pueden realizarse con un 
dato geográfico en función de cómo sea su componente temática. Por ejemplo, 
carece sentido realizar operaciones aritméticas con variables de tipo ordinal o 
nominal, mientras que es perfectamente lógico con los restantes tipos dentro de la 
categoría numérica. También, como veremos en el capítulo 27, influye en la forma 
de representarlo a la hora de elaborar cartografía. 

Además de las componentes espacial y temática, Sinton [32] añade la componen- 
te temporal y propone un esquema sistemático que permite clasificar en grupos las 
distintas clases de información geográfica. Según este esquema, cada una de estas 
componentes puede estar en uno de los siguientes tres estados posibles: fija, controla- 
da o medida. Al medir una de estas componentes, es necesario controlar otra de ellas, 
y fijar la tercera, o bien ignorarla y no tenerla en cuenta (este era el caso explicado 
hasta el momento, en el cual no habíamos citado aún la componente temporal) 

Por ejemplo, si registramos la temperatura a lo largo de un periodo de tiempo 
para un punto concreto, la componente temporal está controlada (tomamos me- 
diciones de temperatura con un intervalo de tiempo establecido), la componente 
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temática (la propia temperatura) está medida, y la componente espacial está fija 
(el termómetro que registra los valores se encuentra siempre en un punto inmóvil) 

En general, la información geográfica se recoge haciendo fija la componente 
temporal, y midiendo o controlando las restantes en función del tipo de información 
de que se trate. 

Un concepto a tener en cuenta en relación con las componentes de la información 
geográfica es la dimensión. Los elementos que registramos pueden ir desde sencillos 
puntos (OD) hasta volúmenes tridimensionales (3D). Un caso particular — y muy 
frecuente — lo encontramos cuando estudiamos la forma tridimensional del terreno, 
pero tratando la elevación como variable temática, no como una parte más de la com- 
ponente espacial. En este caso, tenemos una serie de valores de elevación (Z) locali- 
zados en el plano XY. Esto no es realmente equivalente a utilizar una componente 
espacial tridimensional, ya que no permite recoger en un mismo punto distintos valo- 
res (no puede, por ejemplo, modelizarse la forma de una cueva o un objeto vertical) , 
por lo que se conoce como representación en 2.5 dimensiones (2.5D). La figura 4.1 
muestra esquemáticamente el concepto de dimensión de los datos dentro de un SIG. 


Por ultimo, un aspecto importante de toda variable estudiada es su continuidad. 
Se entiende esta continuidad como la capacidad de la variable para tomar todos los 
valores dentro de un rango definido. La temperatura, la presión o la elevación son 
valores continuos, mientras que ninguna variable de tipo nominal puede ser continua, 
ya que se encuentra limitada a un numero (finito) de identificadores posibles. Por 
ejemplo, en el caso del número de un DNI, los valores son siempre enteros, existe 
el valor 1 y el valor 2, pero no los infinitos valores decimales entre ambos. 

La continuidad de la variable temática se puede estudiar igualmente en relación 
con la componente espacial. Así, existen variables que varían de forma continua en 
el espacio, mientras que otras no lo hacen. Se emplea aquí el concepto matemático 
de continuidad, es decir, que si trazáramos un perfil de la variable a lo largo de 
un recorrido dado, la representación de dicho perfil sería una curva que podría 
dibujarse sin levantar el lápiz del papel 1 

Todas estas ideas referidas a las distintas variables (distintas informaciones 
que pretendemos recoger de una zona de estudio dada) nos servirán para detallar 

1 Definiciones más rigurosas del concepto de continuidad puede encontrarse en cualquier texto 
básico de cálculo elemental o, por ejemplo, en [33] 
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Figura 4.1: Dimensión de los datos geográficos 
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los diferentes enfoques de representación y almacenamiento que veremos en el 
próximo capítulo, y escoger en cada caso el más apropiado. 


4.4. División horizontal de la información geográfica 

Además de dividir la información geográfica en componentes, también dividimos 
esta con criterios puramente espaciales, «cortándola» en unidades menores que 
ocupen una región de amplitud más reducida. Este es un procedimiento similar al 
que encontramos en un mapa impreso, ya que el territorio de un país se encuentra 
cartografiado en diferentes hojas. Las razones para esto son, por una parte, los 
posibles distintos orígenes que los diferentes mapas pueden tener (cada región puede 
ser responsable de fabricar los suyos) y, especialmente, el hecho de que, de no ser así, 
los mapas tendrían un tamaño inmanejable. Si cartografíamos a escala 1:25000 todo 
un país, es obvio que no podemos hacerlo en un único mapa, ya que este sería enorme. 

En el caso de trabajar en un SIG, no tenemos el problema del tamaño físico del 
mapa, ya que no existe tal tamaño. Los datos no ocupan un espacio físico, pero sí 
que requieren un volumen de almacenamiento, y este presenta el mismo problema. 
Recoger a escala 1:25000 todo un país supone un volumen de datos enorme, que 
es conveniente dividir para poder manejar con fluidez. 

En ambos casos, ya sea dentro de un SIG o no, suele resultar necesario emplear 
varios bloques de información (varias hojas) para cubrir un área de trabajo. En 
esta circunstancia, las propias características de un SIG y su forma de trabajo con 
los datos hacen que este proceso sea más sencillo y eficaz. 

La principal cualidad de un SIG para integrar de forma transparente datos 
correspondientes a zonas distintas y formar un mosaico único es la separación que 
existe entre datos y visualización. Los datos son la base de la visualización, pero 
en un SIG estos elementos conforman partes del sistema bien diferenciadas. Esto 
quiere decir que los datos se emplean para crear un resultado visual pero en sí 
mismos no contienen valores relativos a esa visualización. 

De este modo, es posible combinar los datos y después representarlos en su 
conjunto. Un proceso así no puede realizarse con un mapa ya impreso, pues este 
contiene ya elementos de visualización e incluso componentes cartográficos tales 
como una flecha indicando el Norte, una leyenda o una escala. Por ello, aunque pue- 
dan combinarse, realmente no se «funde» la información de cada uno de los mapas 
para conformar uno único. Dicho de otro modo, si tomamos cuatro hojas contiguas 
de una serie de mapas no podemos formar un nuevo mapa que sea indistinguible 
de uno cuatro veces más grande que haya sido impreso en un único pliego de papel. 

En un SIG, sin embargo, sí que sucede así, y la visualización de cuatro o 
más bloques de datos puede ser idéntica a la que obtendría si todos esos datos 
constituyeran un único bloque. Empleando herramientas habituales en un SIG, y 
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si cada uno de esos bloques está almacenado en un fichero, resulta incluso posible, 
unirlos todos y crear un solo fichero que los contenga. 

Una de las razones principales que favorecen esta combinación de datos es el 
hecho de que la escala nominal es en sí un elemento de representación. Como vimos 
en el apartado 3.4, la escala nominal relaciona el tamaño que tiene un objeto en 
la representación con su tamaño real, y la forma en que se recoge la información 
a la hora de realizar medidas de ese objeto viene condicionada por dicha escala, 
de tal modo que el esfuerzo desarrollado en esas mediciones sea coherente con la 
representación que se va a hacer posteriormente al crear el mapa. 

Los datos que manejamos en un SIG tiene una escala de detalle impuesta por 
la precisión de las mediciones, pero no una escala nominal asignada, ya que no 
tienen un tamaño fijo de representación en la pantalla del ordenador o el periférico 
correspondiente, al contrario que un mapa impreso en el que los distintos elementos 
ya se encuentran representados. Esto hace que combinar cartografía clásica a 
distintas escalas sea complejo, ya que los mapas no «casan» bien entre sí. 

En el caso de un SIG, es el usuario el que decide la escala de representación, y 
esta será la misma para todos los datos que se visualicen, independientemente de las 
características de estos. En el contexto actual de datos geográficos, es habitual en- 
contrar situaciones en las que para una zona de terreno disponemos de información 
a una escala, y para otra zona contigua a esta la información disponible es a una 
escala distinta. Con el uso de un SIG, sin embargo, es posible trabajar sin problemas 
con todo el conjunto, sin preocuparse por la integración de sus distintas partes. 

Lógicamente, no debe dejarse de lado nunca el rigor cartográfico y, como se dijo 
en su momento, no olvidar que, aunque podamos representar cualquiera de esos 
datos a la escala que deseemos, los datos en sí no son suficientes para ello y tienen 
unas limitaciones impuestas por su escala inherente. Es decir, que no es necesario 
preocuparse por la integración a la ahora de visualizar y gestionar los datos, pero 
sí a la hora de analizarlos u obtener resultados a partir de ellos. No obstante, el 
proceso de combinación es en cualquier caso transparente para el usuario que 
visualiza esos datos en un SIG, y la operación pasa de ser algo tedioso y complejo 
a algo prácticamente inapreciable dentro del SIG, pues es este quien se encarga 
de ocultar toda esa complejidad y simplemente generar las representaciones según 
los parámetros requeridos en cada momento. 

La figura 4.2 muestra un ejemplo de lo anterior en el que puede verse cómo 
varias fotografías aéreas forman un mosaico que cubre una zona dada, teniendo 
estas distinto nivel de detalle tal y como puede apreciarse. 


4.5. División vertical de la información. Capas 

Uno de los grandes éxitos de los SIG es su estructura de manejo de informa- 
ción geográfica, que facilita todas las operaciones que se llevan a cabo con esta. 
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Figura 4.2: Integración de datos en sentido horizontal. A pesar de que la escala de detalle 
es distinta para las fotografías aéreas de la imagen, estas se combinan sin problema 
en un SIG, representándose a una escala dada todas ellas de forma sencilla. Nótese la 
mayor definición en la parte inferior de la imagen, que se forma con imágenes tomadas 
a una escala distinta a la de las de la parte superior. Adviértase igualmente la distinta 
iluminación, ya que han sido tomadas en fecha y horas distintas. 


El concepto de capa , imprescindible para comprender todo SIG, es una de las 
grandes virtudes inherentes a los Sistemas de Información Geográfica, en cuanto 
que favorece la correcta estructuración de la información y el trabajo con ella. 

La división horizontal que ya hemos visto no es algo nuevo, y la gran mayoría 
de los mapas clásicos cubren una porción relativamente pequeña de la superficie 
terrestre. Combinando distintos mapas podemos formar uno mayor que cubra una 
extensión más amplia, y aunque ya hemos visto que esto mismo puede realizarse 
con un SIG y la tarea resulta así más sencilla, no resulta una operación tan compleja 
y extraña en el caso de no trabajar en un entorno SIG. 

Más difícil, sin embargo, es combinar distintos tipos de información, como por 
ejemplo la contenida en un mapa topográfico y la existente en un mapa de tipos 
de suelo y otro de vegetación potencial. Para una misma zona, trabajaremos con 
varios mapas simultáneamente, y combinar estos para la realización de operaciones 
en las que intervengan todos ellos (supongamos, por ejemplo, calcular el área total 
de las zonas con un tipo de suelo dado donde la vegetación corresponde a una clase 
concreta y se encuentran por encima de 1000 metros) es difícil y generalmente 
también impreciso. 

En el caso de un SIG, los distintos tipos de información se pueden combinar 
de forma sencilla y limpia, y no aparecen los mismos problemas. Esto es así debido 
a que la idea de capa permite dividir la información espacial referida a una zona 
de estudio en varios niveles, de tal forma que, pese a coincidir sobre un mismo 
emplazamiento, información sobre distintas variables se encuentra recogida de 
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forma independiente. Es decir, en función de la componente temática se establecen 
distintos bloques de datos espaciales. 

Para comprender mejor el concepto de capa, pensemos en un mapa topográfico 
clásico. En él vamos a encontrar elementos como curvas de nivel, carreteras, núcleos 
urbanos, o simbología relativa a edificios y puntos singulares (iglesias, monumentos, 
etc.) Todos estos elementos en su conjunto componen el mapa, y aparecen en una 
misma hoja como una unidad coherente de información geográfica. No obstante, 
cada uno de los de estos grupos de información recogidos — elevaciones, red viaria, 
núcleos urbanos, puntos de interés arquitectónico — pueden recogerse de forma in- 
dependiente, y combinarse al componer el mapa según las necesidades del momento, 
o bien combinarse de modo distinto o emplearse individualmente (Figura 4.3). 



Elevación 
Uso de suelo 
Suelo 
Hidrografía 


Figura 4.3: Concepto de capa de información geográfica dentro de un SIG 

La figura es lo suficientemente gráfica como para entender la razón de que a 
este tipo de división la denominemos vertical , así como el propio nombre de capa, 
ya que de ella resulta una serie de diferentes niveles que se pueden superponer 
según el criterio particular de cada usuario de SIG. 

Toda la información geográfica con que trabajemos en un SIG va a ser en forma 
de capas. Cada una de estas capas puede abrirse de forma independiente en un SIG 
y utilizarse por sí misma o en conjunto con otras en la combinación que se desee. 

Esta forma de proceder no es exclusiva de los SIG, y antes de la aparición 
de estos ya existían experiencias previas en este sentido, combinándose capas de 
información geográfica para la realización de análisis (véase 2.6). Es, sin embargo, 
con la aparición de los SIG cuando esta metodología se aplica de forma regular 
y se establece sistemáticamente dicha estructuración de la información geográfica. 

Así, la visualización, el análisis, y todas las acciones que se realizan sobre la 
información geográfica dentro de un SIG, se llevan a cabo sobre un conjunto de 
capas, entendiéndose cada una de ellas como la unidad fundamental de información 
sobre una zona dada y un tipo de información concreta. 

Muy habitualmente las capas se conocen también como capas temáticas o 
temas, términos bastante extendidos que hacen referencia al mismo concepto. 

La relevancia del concepto de capa como elemento fundamental de un SIG 
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es enorme, pues realmente constituye el marco básico sobre el que se van a llevar 
a cabo gran parte de las operaciones. Algunas de las posibilidades que brinda 
esta filosofía ya las conocemos. Por ejemplo, vimos en el apartado dedicado a la 
generalización cartográfica cómo en un SIG podemos utilizar diferentes «versiones» 
de los datos correspondientes a una zona concreta, y representar una u otra de 
ellas en función de la escala de trabajo. Para un tipo de información, por ejemplo 
los usos del suelo, estas versiones se almacenarán como distintas capas. La capa 
es así la unidad fundamental no solo en términos de un área dada, sino también de 
una escala concreta, y permite una división de los datos óptima a todos los efectos. 

Al igual que veíamos en el apartado anterior, las capas nos van a permitir la 
combinación de datos a distinta escala, no ya en este caso datos contiguos, sino 
datos correspondientes a un mismo área pero con variables distintas. Esto es de 
gran utilidad en el trabajo habitual, ya que no todas las variables se recogen con 
un mismo nivel de detalle, y el detalle con el que podemos encontrar una capa de 
elevaciones va a ser generalmente mucho mayor que el que cabe esperar para una 
capa de, digamos, fitología. 

En realidad, y en el lenguaje habitual de trabajo con SIG, la capa no define 
únicamente una división vertical, sino también una horizontal. Es más sencillo 
visualizar la idea de capa con un esquema como el de la figura 4.3, en el que las 
distintas variables se «apilan» en capas de información superpuestas. Sin embargo, 
las divisiones horizontales en un mosaico de datos también se consideran como 
capas distintas en un SIG, pese a contener una misma variable y un mismo tipo 
de información. Por tanto, y aunque la división vertical sea la que verdaderamente 
define la idea de capa, cuando hablamos de una capa de datos en un SIG nos 
referimos a un «trozo» de toda la información disponible, que implica una sección 
en la dimensión vertical (la de las variables existentes que pueden estudiarse) y 
un recorte en la horizontal (la de la superficie geográfica) . 

Las capas pueden emplearse también para incorporar en cierta forma la variable 
temporal si se considera que la dimensión vertical es el tiempo. Aunque no es 
la manera más adecuada, y en la actualidad el manejo del tiempo es uno de los 
principales problemas a resolver en el diseño de los SIG, podemos trabajar con 
varias capas que representen una misma información y una misma zona, pero en 
instantes distintos. Esto no es distinto a trabajar con mapas clásicos correspon- 
dientes a diferentes instantes, salvo que en el caso de capas cada elemento de la 
información se encuentra separado a su vez. 

Por último, es importante el hecho de que la separación de la información 
en capas evita la redundancia de datos, ya que cada capa contiene un tipo de 
información concreto. En un mapa clásico se presentan siempre varias variables, 
algunas de ellas presentes con carácter general, tales como nombres de ciudades 
principales o vías más importantes de comunicación. Es decir, que un mapa de 
usos de suelo o un mapa geológico van a contener otras variables, que en ocasiones 


se añaden a este para enriquecerlo. Unas curvas de nivel, por ejemplo, permitirán 
una mejor interpretación de esa geología. 

Al dividir toda la información en capas, podemos combinar curvas de nivel y 
geología, añadir otros elementos, o bien representarlas de forma aislada, algo que no 
resulta posible si los datos de los que disponemos ya vienen unidos inseparablemente, 
como sucede en el caso de la cartografía impresa. La división en capas ofrece un 
mayor número de posibilidades distintas de trabajo y, como iremos viendo a lo largo 
de gran parte de este libro, también mayores posibilidades de análisis y proceso. 

En resumen, el trabajo con capas permite una estructura más organizada y 
una mayor atomización de los datos, con las consecuentes ventajas en el almace- 
namiento, manejo y funcionalidad que esto conlleva. 

4.6. Resumen 

Los datos son una de las piezas más importantes del sistema SIG. Entendemos 
por dato un conjunto de valores o elementos que representan algo. La interpretación 
correcta de esos datos los dota de significado y produce información. 

La información geográfica tiene dos componentes: una componente temática 
y una componente geográfica. Estas van unidas y conforman una unidad única 
de información geográfica, aunque pueden separarse y analizarse por separado. 
Mientras que la componente geográfica tiene un carácter fundamentalmente nu- 
mérico, la componente temática puede incluir una o varias variables y estas ser 
de naturaleza muy variada. 

La información geográfica se divide horizontal y verticalmente. Las unidades 
mediante que incorporamos esta información a un SIG se conocen como capas , y son 
uno de los elementos primordiales en la estructura de manejo de datos de todo SIG. 
El trabajo con capas más hace transparente la gestión de la información geográfica 
en un SIG, permite una mejor integración de distintos datos, y es la base para 
muchas operaciones, algunas de las cuales iremos viendo en capítulos sucesivos. 
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Capítulo 5 


Modelos para la información geográfica 


La realidad geográfica debe recogerse en un formato que pueda ser entendido por el 
ordenador y así susceptible de emplearse dentro de un SIG. En este capítulo se mostrarán 
los enfoques conceptuales y prácticos más frecuentes para llevar esto a cabo, que a su vez 
son los responsables indirectos de las arquitecturas subyacentes en los SIG. Para ello, se 
estudiarán los distintos tipos de información con los que trabajamos en un SIG y las formas 
más adecuadas de entender, interpretar y manejar esta. 


5.1. Introducción 

Los datos son, como ya sabemos, una parte imprescindible del SIG, ya que sin 
ellos las aplicaciones SIG y los restantes elementos que se encuentran en torno a estas 
no tienen utilidad alguna. Necesitamos conocer el área geográfica que estudiamos 
en un SIG (es decir, tener datos sobre ella), para así poder proceder a dicho estudio. 

No obstante, convertir ese área geográfica y la información acerca de ella en 
un dato susceptible de ser incorporado a un SIG no resulta una tarea sencilla. 
Desde los orígenes de los SIG, una de las preocupaciones principales ha sido la de 
representar de la mejor manera posible toda la información que podemos extraer 
de una zona geográfica dada, de tal modo que pueda almacenarse y analizarse en el 
entorno de un SIG. Este proceso de representación, que ya desde el inicio planteaba 
problemas a los creadores de los primeros SIG, ha sido el responsable en gran 
medida de la arquitectura y forma de los SIG actuales, y a él se debe en buena parte 
el desarrollo que han experimentado tanto los SIG en sí como las disciplinas afines. 

Describir los enfoques teóricos existentes para convertir la realidad relativa 
a una variable dada en una capa que la contenga de la forma más precisa posible 
y pueda ser empleada en un SIG es el objeto de este capítulo. Este proceso implica 
la construcción de un modelo (el dato geográfico) , que representa la realidad y 
puede servir para conocer esta en profundidad a través de análisis que no se llevan 
a cabo sobre dicha realidad, sino sobre el modelo en sí. 

El problema principal reside en el hecho de que el detalle real que encontramos 
en la naturaleza es prácticamente infinito, mientras que la representación y almace- 
namiento de esa realidad es finita. Se hace necesario extraer una serie de elementos 
y valores característicos, los cuales en ultima instancia se recogerán como valores 
numéricos dentro del SIG (pues son estos los que maneja un ordenador), y podrán 
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interpretarse como el anteriormente citado modelo. El camino que lleva desde la 
realidad hasta ese conjunto de meros valores numéricos pasa por tres niveles: 

■ Establecimiento de un modelo geográfico. Es decir, un modelo conceptual 
de la realidad geográfica y su comportamiento. 

■ Establecimiento de un modelo de representación. Es decir, una forma 
de recoger el anterior modelo conceptual y sus características propias, re- 
duciéndolo a una serie finita de elementos. 

■ Establecimiento de un modelo de almacenamiento. Es decir, un esquema 
de cómo almacenar los distintos elementos del modelo de representación. 

El modelo geográfico es un ente puramente conceptual (de alto nivel), mientras 
que el de almacenamiento es más un concepto técnico inherente a la naturaleza 
informática del SIG (de bajo nivel) 


5.2. Modelos geográficos 

El primer paso hacia la creación del dato geográfico implica el establecimiento 
de un modelo conceptual relativo a cómo se ha de interpretar la realidad geográfica. 
Se trata de conceptualizar el espacio estudiado, la variable tratada y la variación 
de esta a lo largo del espacio. Este modelo geográfico es un esquema mental que 
constituye una forma particular de entender el hecho geográfico en sí, pero que 
todavía no incorpora elementos relativos a su representación o almacenamiento. 

Existen muchos modelos geográficos distintos, entre los cuales cabe destacar 
dos de ellos [34] : 

■ Campos 

■ Entidades discretas 

5.2.1. Campos 

Un campo es un modelo de variación dentro de un marco n-dimensional, en el 
cual en cada punto dentro de dicho marco se tiene un valor de la variable estudiada. 
En su concepto matemático, un campo es una función de la forma ip : R” —> R m , 
esto es, una función que asocia cada punto de un espacio vectorial con otro en un 
espacio vectorial distinto. 

En el caso más habitual, m= 1, es decir, que a cada punto del espacio vectorial 
origen se le asocia un único valor escalar. Se tiene así lo que se denomina un campo 
escalar. La mayoría de las variables que se emplean en un SIG necesitan un único 
valor para describirse (piénsese en variables como la elevación, la temperatura o 
la presión atmosférica, que solo requieren de un número para expresarse), por lo 
que los campos escalares son los más habituales en el ámbito geográfico. 

No obstante, también encontramos los denominados campos vectoriales 1 , en el 


J E1 empleo del término vectorial para calificar a los campos vectoriales o los espacios 
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cual el espacio vectorial de destino es multidimensional. Por ejemplo, para definir 
el movimiento del viento en un punto geográfico no basta con un único valor, sino 
dos: la velocidad y la dirección en la que sopla dicho viento. Dentro de un SIG, 
es habitual recoger los campos vectoriales como un conjunto de varios campos 
escalares, cada uno de ellos en una capa distinta. Así, se tendría una capa con 
la dirección y otra con la velocidad, ambas magnitudes escalares. Operando de 
esta manera, la solución no es única, ya que el vector resultante puede definirse 
mediante su módulo y dirección (como en el caso anterior), pero también por sus 
propias coordenadas en la base del espacio vectorial destino (en el caso anterior, 
las componentes x e y del vector que indica el movimiento del viento). 

El espacio vectorial de origen puede ser bidimensional, es decir, una función 
de la forma f{x,y), representando x e y las coordenadas geográficas. Este es el 
caso habitual en las capas que se emplean en un SIG, donde las variables que 
estudiamos adquieren uno u otro valor en función de su posición dentro de un 
sistema coordenado de referencia. 

Puede añadirse una tercera dimensión, de tal modo que los valores dependan no 
solo de la posición sino igualmente de la elevación. Se tendría una función de la forma 
f(x,y,z ) . Para el caso, por ejemplo, de la temperatura del aire, esta depende no solo 
de la localización, sino también de la altura. Otro ejemplo puede ser el porcentaje 
de arena en el suelo, que depende de la localización pero también de la profundidad. 

Igualmente, aunque en general es poco habitual en el marco de los SIG, puede 
añadirse la variable tiempo, teniéndose funciones de la forma f(x,y,t) o f(x,y,z,t) 

Por definición, un campo es continuo, ya que todos los puntos tienen un valor 
asociado. De igual modo, este valor es único, y no existe un elemento del espacio 
vectorial de partida que tenga asociados varios elementos del de destino, sean estos 
escalares o vectores. 

Por su propia naturaleza los campos son ideales para modelizar variables que 
varían de forma continua en el espacio, entre ellas la practica totalidad de variables fí- 
sicas del medio, tales como temperatura del aire, presión atmosférica, elevación, etc. 

Los campos se asocian con las denominadas coberturas, termino este más 
empleado en el ámbito SIG. En una cobertura existe un valor único para todos 
los puntos de una región dada. 

5.2.2. Entidades discretas 

A diferencia de los campos, el modelo de entidades discretas no asocia a cada 
punto geográfico un valor, sino que concibe un entorno geográfico como un espacio 
vacío sobre el que se sitúan distintos elementos (entidades) que lo van rellenando. 

vectoriales no debe confundirse con el modelo de representación vectorial que veremos más 
adelante en este capítulo. En el caso de campos y espacio, se trata de la terminología estándar del 
ámbito matemático, mientras que en el modelo de representación vectorial es una terminología 
propia de los Sistemas de Información Geográfica. 



82 


Sistemas de Información Geográfica 


Cada una de dichas entidades posee unas características propias, constantes para 
toda ellas, que son las que conferirán sus propiedades particulares a los puntos 
que se sitúen en su interior. 

Un punto puede no pertenecer a ninguna entidad, o bien a varias de ellas, según 
sea la disposición de estas. Para un espacio dado, las entidades pueden ser todos 
aquellos elementos geométricos existentes en el mismo, tales como puntos, líneas, 
polígonos o, en el caso de ser dicho espacio de dimensión mayor que dos, también 
volúmenes. 

Es fácil ver que el modelo de entidades discretas no es tan adecuado como los 
campos para conceptualizar variables continuas, ya que la continuidad de estas es 
opuesta al esquema discreto planteado. No obstante, otras variables no continuas se 
modelizan mejor mediante entidades discretas, ya que la forma en que se presentan 
coincide en cierta medida con dichas entidades como unidades mínimas. 

La presencia de vías de comunicación, por ejemplo, se puede asimilar perfec- 
tamente a este modelo. Se tiene un espacio vacío (sin vías), en el cual se disponen 
los distintos viales en una serie de localizaciones concretas. Hay puntos que no 
estarán afectados por ninguna entidad, mientras que otros (los situados en las 
intersecciones) lo están por varias de ellas. 

Las variables de tipo nominal y alfanumérico — las cuales no son, como vimos, 
continuas — tales como el tipo de suelo en un punto o el número de parcela catastral 
al que pertenece dicho punto, también se adaptan bien al modelo de entidades 
discretas. 

Otra diferencia entre los campos y las entidades discretas es que estas últimas 
son en general más sencillas de comprender como concepto fuera de un ámbito 
técnico. Los campos son conceptos matemáticos que requieren un mayor grado 
de abstracción, y para la mayoría de la gente no resultan tan claros. Como algunos 
apuntan [35], el lenguaje habitual contiene un numero mayor de expresiones y 
recursos para describir la realidad geográfica en base a entidades discretas que en 
base a campos o conceptos abstractos similares. 


5.3. Modelos de representación 

Los modelos geográficos nos ofrecen una concepción particular del espacio 
geográfico y sus atributos. En base a ellos, el siguiente paso es reducir las pro- 
piedades de dichos modelos a un conjunto finito de elementos, de tal modo que 
el registro de dichos elementos sirva para almacenar la realidad que los modelos 
geográficos describen. Para ello, empleamos los modelos de representación, también 
denominados modelos de datos. 

Antes de entrar a describir los distintos modelos de representación, veamos 
algunos ejemplos que nos presentarán casos particulares de estos modelos, acla- 
rando sus diferencias antes de proceder a una definición más detallada. En la 
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figura 5.1 pueden verse distintas formas de representar la elevación de una zona, 
la cual, como ya sabemos, es una variable continua y puede concebirse mediante 
un campo escalar. Por el contrario, la red viaria se adapta mejor a un modelo 
de entidades discretas, y se muestran en la figura 5.2 sendas representaciones de 
esta variable según distintos modelos de datos. Mediante los ejemplos de estas 
figuras presentaremos los modelos de datos principales, así como su relación con 
los modelos conceptuales estudiados en el punto anterior. 



Figura 5.1: Distintas formas de representar una capa con información altitudinal. 



Figura 5.2: Distintas formas de representar una capa con información sobre una red viaria. 


Comenzando con la elevación, encontramos cuatro distintas formas de repre- 
sentarla, a saber: 
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■ Curvas de nivel. La representación clásica empleada tradicionalmente en 
los mapas de papel. Se recoge la elevación en una serie de curvas, que marcan 
los puntos en los que dicha elevación es múltiplo de una cierta cantidad (la 
equidistancia). En el ejemplo propuesto, se muestran curvas con elevaciones 
múltiplos de 10 metros. 

■ Una malla de celdas regulares, en cada una de las cuales se dispone un 
valor, que corresponde a las características de la zona ocupada por dicha 
celda. En este caso, cada celda tiene un valor de altura propio, que al con- 
vertirse en un color mediante el uso de una escala de colores, da lugar a la 
imagen mostrada. 

■ Puntos regulares. Una serie de puntos regularmente espaciados. Existe 
información de la elevación solo en dichos puntos. La información se muestra 
como etiqueta asociada a cada punto. 

■ Red de Triángulos Irregulares. Una Red de Triángulos Irregulares (TIN 
en sus siglas inglesas, de Triangulated Irregular Network ), es una estructura 
en la cual se toman los puntos más característicos del relieve y en base a ellos 
se construye una teselación en triángulos con unas condiciones particulares. 
Cada uno de los triángulos posee unas propiedades comunes en cuanto a 
su relieve. Veremos más adelante en detalle este tipo de estructuras. Por 
el momento, basta recordar que los elementos básicos de esta forma de 
representación son triángulos. 

Para el caso de las vías encontramos dos representaciones distintas: 

■ Una malla de celdas como la citada en el caso anterior. Las celdas de vía 
tiene un valor (representado aquí en azul) distinto de las que se encuentran 
fuera de la vía (con valor representado aquí en blanco) 

■ Un conjunto de líneas representando los trazados de las vías. 

En este ultimo caso las celdas se han elegido de un tamaño excesivamente gran- 
de, con el fin de que pueda apreciarse de forma inmediata la diferencia existente. 
Veremos más adelante que, como no es difícil intuir, la representación mediante 
celdas no es tan adecuada para el caso de una capa de vías (aunque para el caso 
de la elevación da lugar a una imagen con un aspecto inmejorable y altamente 
informativo) , cuando estudiemos los aspectos relativos a la precisión en los distintos 
modelos de almacenamiento. 

Como vemos, para un mismo tipo de información existen diversas alternativas 
en cuanto a la forma de materializar la realidad y plasmar el modelo geográfico 
concreto. Estas formas las podemos clasificar en dos grupos principales: modelo 
de representación ráster y modelo de representación vectorial. 

Si se han seguido los capítulos de partes anteriores, probablemente los tér- 
minos ráster y vectorial no resulten extraños, ya que han aparecido con cierta 
frecuencia. Esto es así porque, además de definir dichos términos los principales 
modelos de representación de la información geográfica dentro de un SIG, se han 
venido utilizando tradicionalmente para definir a los SIG en sí, en función de si 
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sus capacidades se hallaban más enfocadas al manejo y análisis de información 
en formato ráster o en formato vectorial. A día de hoy, esa diferencia no es tan 
patente y los SIG más habituales pueden trabajar con ambos indistintamente, 
pudiendo realizar las tareas que resultan más adecuadas de llevar a cabo tanto 
con uno como con otro tipo de representación. 

En lineas generales podemos decir que el modelo ráster se basa en una división 
sistemática del espacio, la cual cubre todo este (a este concepto se le denomina se 
denomina teselación), caracterizándolo como un conjunto de unidades elementales 
(las celdas de las mallas vistas en los ejemplos). El modelo vectorial, por su parte, no 
divide el espacio completamente, sino que lo define mediante una serie de elementos 
geométricos con valores asociados, siendo la disposición de estos no sistemática, 
sino guardando relación con los objetos geográficos presentes en la zona de estudio. 

En un principio, puede pensarse que el modelo ráster se asemeja al modelo 
geográfico de campos, mientras que el vectorial concuerda con el de entidades 
discretas. Aunque en cierta medida puede considerarse que así sucede y existe tal 
dualidad, no es del todo cierta esta equiparación, como discutiremos con algo más 
de detalle en los siguientes puntos. 

De forma esquemática, los enfoques de los modelos de representación ráster 
y vectorial se muestran en la figura 5.3 




Figura 5.3: Comparación entre los esquema del modelo de representación vectorial (a) 
y ráster (b). 

Podemos entender estos enfoques haciendo uso del esquema de Sinton presenta- 
do con anterioridad. En el modelo vectorial controlamos la definición de los valores 
asociados, y medimos la localización y forma de estos, dejando fijo el tiempo. En 
el modelo ráster, aunque la componente temporal también es fija, la componente 
que controlamos es la espacial (a través de la sistematicidad de la malla) , mientras 
que medimos la naturaleza de los valores en cada una de las celdas. 

Antes de pasar a la definición detallada de los modelos ráster y vectorial, 
mencionar que, como modelos principales empleados para la definición de capas de 
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información geográfica, las expresiones capa vectorial y capa ráster son de uso habi- 
tual, y se emplearán de aquí en adelante tanto en este como en posteriores capítulos. 


5.3.1. Modelo ráster 

En el modelo ráster, la zona de estudio se divide de forma sistemática en una 
serie de unidades mínimas (denominadas habitualmente celdas ) , y para cada una 
de estas se recoge la información pertinente que la describe. Se puede ver esto en 
detalle en la figura 5.4, que muestra aumentada una porción la malla ráster de 
elevaciones de la figura 5.1, de modo que los límites de las celdas se hacen patentes 
y puede además representarse en cada una de ellas su valor asociado. 


132.90 133.90 135.60 139.20 140.60 144.40 

126.80 128.50 131.40 133.90 135.90 139.90 

122.30 124.10 125.80 128.50 131.80 135.60 

118.70 119.90 121.90 124.30 128.20 131.50 


Figura 5.4: Celdas de una malla ráster con sus valores asociados. 

Aunque la malla de celdas puede contener información sobre varias variables, 
lo habitual es que trate una única variable. Es decir, que se tenga un único valor 
para cada una de las celdas. 

La característica principal del modelo ráster, y que le confiere gran parte de sus 
propiedades más interesantes, especialmente de cara al análisis, es su sistematicidad. 
La división del espacio en unidades mínimas se lleva a cabo de forma sistemática de 
acuerdo con algún patrón, de tal modo que existe una relación implícita entre las 
celdas, ya que estas son contiguas entre sí, cubren todo el espacio, y no se solapan. 
Por tanto, la posición de una celda depende de la de las restantes, para así conformar 
en conjunto toda la malla regular que cumple las anteriores características. Dicho 
de otro modo, el orden propio de las celdas, presente gracias a la división sistemática 
realizada, aporta un elemento adicional que las relaciona entre sí. 

Como unidad mínima pueden tomarse elementos de diversas formas. La más 
habitual es mediante unidades de forma cuadrada, aunque también pueden ser 
formas rectangulares, o incluso triangulares o hexagonales [36]. No obstante, los 
SIG habituales se limitan a modelos de celdas cuadradas, y las implementaciones 
de otros modelos son de uso muy reducido y en aplicaciones muy especificas que 
en general no están orientadas al uso general ni disponibles de forma accesible al 
usuario común. Junto a esto, la información geográfica en formatos ráster distintos 
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de la división en celdas cuadradas es prácticamente inexistente, haciendo más 
difícil el empleo de estos formatos en condiciones normales de trabajo. 

De igual modo, existen representaciones ráster no regulares, en las que todas 
las unidades mínimas no tienen un mismo tamaño. Este tipo de representaciones 
no tiene apenas presencia en los SIG, pero son habituales en otros ámbitos tales 
como el de la representaciones 3D, con unos requerimientos bien distintos 2 . Esto 
está relacionado a su vez con los modelos de almacenamiento ráster, que veremos 
más adelante en este mismo capítulo. 

En todos los casos, la división en celdas no depende de la variable estudiada, y 
es una división geográfica. Esto lo diferencia de otras divisiones como el caso de la 
Red de Triángulos Irregulares, que, a pesar de ser una teselacion que cubre todo el 
espacio, está basada en la propia variable de elevación, y dicha división (número, 
forma y disposición de los triángulos) sería distinta en caso de que los valores de 
elevación fueran otros. 

Siendo, pues, las mallas ráster de celdas cuadradas las más habituales, pasemos 
a ver algo más acerca de estas y su elementos básicos. Dos son los elementos 
principales que resultan necesarios para una definición completa de una capa ráster: 

■ Una localización geográfica exacta de alguna celda y una distancia entre 
celdas, para en base a ellas, y en virtud de la regularidad de la malla, conocer 
las coordenadas de las restantes. 

■ Un conjunto de valores correspondientes a las celdas. 

En el modelo ráster no se recogen de forma explícita las coordenadas de cada 
una de las celdas, sino tan solo los valores de estas. No resulta necesario acompañar 
a dichos valores de un emplazamiento espacial concreto, pues hacen referencia a 
un elemento particular de la malla, la cual representa una estructura fija y regular. 
No obstante, sí que es necesario emplazar dicha malla en el espacio para después 
poder calcular las coordenadas particulares de cada celda. 

Lo más habitual es definir el emplazamiento de una única celda (habitualmente 
la celda superior izquierda), una orientación fija, y una distancia entre las celdas 
(el paso de la malla). Como se muestra en la figura 5.5, esto ya permite, mediante 
un sencillo cálculo, conocer las coordenadas de todas las celdas sin necesidad de 
almacenar estas. 

La orientación de las capas ráster es habitualmente Norte-Sur, de tal modo 
que si pasamos de la primera a la segunda fila estamos descendiendo en latitud 
(este hecho sería matizable en función de la proyección empleada) . Dicho de otra 
forma, la parte de arriba de la imagen es el norte, y la de abajo es el sur. Esta 
convención simplifica el trabajo con capas ráster dentro de un SIG y permite 
aplicar directamente la fórmula mostrada en la figura 5.5. 

2 Véase, por ejemplo, el concepto de Nivel Continuo de Detalle (Continuous Level of Detail, 
CLOD), para lograr representaciones de detalle con el menor gasto de recursos posible, y que 
es habitual en este campo. 
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y' = y + 2d 


Figura 5.5: La estructura regular de la malla ráster permite conocer las coordenadas de 
las celdas sin necesidad de almacenar estas, sino tan solo recogiendo algunos parámetros 
de la malla como la localización de una celda base (x,y), la orientación global o el tamaño 
de celda (d) . 


No obstante, puede suceder que la fuente de datos original no se adhiera a 
este formato (por ejemplo, una fotografía aérea en la que el avión no volaba en 
dirección Norte-Sur o perpendicular, o una porción de un mapa escaneado que 
no tiene tampoco esa orientación). En tal caso, y puesto que los SIG trabajan en 
general con tal orientación en sus representaciones y a la hora de incorporar capas 
ráster, nos encontraremos con situaciones como la mostrada en la figura 5.6 



Figura 5.6: Aunque la zona de estudio no tenga orientación Norte-Sur, los SIG trabajan 
habitualmente con esta orientación, y las imágenes deben adecuarse a ello. 

En ella vemos cómo la orientación de la banda de estudio recogida es distinta 
de la Norte-Sur de la imagen, lo cual, unido a la forma rectangular que ha de tener 
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dicha imagen, causa la aparición de zonas sin información (en negro). Esto implica 
por una parte la necesidad de almacenar un gran número de valores sin interés, 
y por otra la necesidad de especificar de algún modo que todas esas celdas que 
aparecen en negro en la imagen son realmente celdas para las cuales no se dispone 
de información. Esto último se suele llevar a cabo mediante la definición de un 
valor arbitrario que indique la falta de datos (denominado generalmente valor de 
sin datos), que codifica tal situación, de tal modo que pueden ignorarse las celdas 
con dicho valor a la hora de representar o analizar la capa ráster en cuestión. 

El otro parámetro necesario junto con la orientación de la malla y la situación 
geográfica de una de sus celdas es el denominado tamaño de celda o tamaño de píxel, 
también conocido como resolución, pues, en efecto, su magnitud define la resolución 
de la capa. Un tamaño de celda mayor implica una menor resolución, y viceversa. 

Además de servir para el cálculo de coordenadas de las celdas y definir la 
estructura de la malla, el tamaño de celda permite calcular áreas, ya que establece 
el área ocupada por cada celda. Asimismo, y como aspecto más relevante, el tamaño 
de celda determina la precisión con la que se recoge una variable dentro de una 
capa ráster, y puede considerarse como el equivalente conceptual a la escala de 
dicha capa. Por esta razón, es importante trabajar con capas ráster de un tamaño 
de celda adecuado para el tipo de análisis o tarea que quiera desarrollarse. 

Así, un análisis microtopográfico en el cual resulta necesario registrar la va- 
riación del relieve a pequeña escala no puede llevarse a cabo con una capa de 
elevaciones con tamaño de celda de 100 metros, ya que toda la variabilidad menor a 
esos 100 metros se pierde. No debe olvidarse que cada celda registra un único valor 
de la variable, y esta se considera constante dentro de dicha celda. Un tamaño de 
100 metros implicaría la recogida de un único valor para cada hectárea de terreno, 
lo cual no es suficiente en este caso. 

Muchos son los factores que influyen en el tamaño de celda de una capa ráster, 
entre ellos las características de los datos iniciales con los que se ha creado dicha 
capa o los medios particulares con que estos han sido recogidos. En la figura 
5.7 pueden observarse dos imágenes aéreas del juego de datos de ejemplo (las 
imágenes son un tipo particular de capa ráster, como en breve veremos), con 
distinta resolución. Esta, al ser distinta, las hace válidas para uno u otro tipo de 
uso. Vemos claramente que en en la imagen en blanco y negro (cuyo tamaño de 
píxel es de 5 metros) se distinguen las distintas áreas de cultivo, mientras que en 
la imagen en color (con tamaño de píxel de 25 metros), estos no se distinguen. 
Todos aquellos análisis que requieran disponer de información por debajo de esos 
25 metros, no podrán ser llevados a cabo con esta última imagen. 

Para el caso de capas ráster de variables continuas, en la sección 13.2.8 se da 
información detallada sobre cómo definir el tamaño de celda óptimo a la hora de 
crear estas a partir de datos de otra clase tales como datos vectoriales. 

Una vez conocemos el formato ráster, podemos relacionarlo con lo que ya 
hemos visto relativo a los modelos geográficos. En primer lugar, y por sus propias 
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Figura 5.7: Imágenes de diferente resolución en función del sensor con que han sido 
obtenidas. Al tener distintos tamaños de píxel, servirán para distintos usos dentro de un SIG. 


características, puede pensarse que la representación ráster es más adecuada para 
variables de tipo continuo que varían a su vez de forma continua en el espacio 
geográfico. Es decir, es más próxima al modelo geográfico de campos que al de 
entidades discretas. Esto es así debido principalmente a que una capa ráster cubre 
todo el espacio, y ello favorece el estudio de dicha variabilidad. No obstante, no 
debe considerarse que el ámbito de las variables continuas y los campos es exclusivo 
de las capas ráster. De hecho, de las cuatro representaciones mostradas para el 
caso de la elevación, solo una de ellas es de tipo ráster. 

Sí es cierto, no obstante, que el formato ráster es especialmente adecuado para 
el análisis de la información geográfica, en especial cuando esta es de tipo continuo. 
Esto es así porque el principal elemento de las capas ráster es, como ya se ha dicho, 
su estructura sistemática. Si a esta le unimos la regularidad que se presenta en la 
forma más extendida de representación ráster (la de celdas cuadradas regulares), 
tenemos un modelo óptimo para el análisis, que simplifica en gran medida este 
y hace más sencilla la implementación de los algoritmos correspondientes. Es por 
ello que, tradicionalmente, los SIG con mayor soporte para datos ráster han sido 
aquellos que presentaban a su vez un mayor número de funcionalidades de análisis 
en áreas tales como el estudio del relieve, el análisis de costes u otros similares. 

No obstante, ello no restringe el alcance del formato. Variables que no resul- 
ta tan óptimo concebir como campos, tales como una red vial, también puede 
expresarse como una capa ráster, como hemos visto en la figura 5.2. 

El caso de las imágenes 

Un caso especial de capa ráster son las imágenes, de las que hemos visto ya un 
ejemplo al tratar el tamaño de celda. Tanto si estas proceden de un sensor digital 
o bien han sido escaneadas, los sensores correspondientes generan una estructura 
en forma de malla que se ajusta al modelo de representación ráster. Este hecho 
tiene gran importancia, pues facilita el análisis conjunto de imágenes y capas de 
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datos con otro tipo de información, haciendo que este sea sumamente más sencillo, 
al compartir el modelo de representación. 

Mientras que, como hemos visto en los ejemplos, una misma información se 
puede recoger en formatos ráster y vectorial, las imágenes se recogen únicamente 
en formato ráster, tanto por ser ese modelo mucho más adecuado, como por ser 
mucho más coherente con el tipo de información y la procedencia de esta. 

El concepto de celda en una malla ráster es el equivalente al de píxel 3 , bien 
conocido en el campo de las imágenes digitales. Así, cuando decimos que una 
cámara digital tiene tres megapíxeles, queremos decir que captura un total de tres 
millones de píxeles. De otra forma, la malla ráster que se genera tiene tres millones 
de celdas. Las imágenes con las que trabajamos en un SIG no se diferencian de 
las que tomamos con una cámara digital, salvo en el hecho particular de que 
representan una porción de terreno dentro de un sistema de coordenadas dado, 
pero la estructura es la misma: una malla de celdas (píxeles). 

Otra particularidad de las imágenes es la presencia de bandas. Los valores reco- 
gidos en las imágenes indican de forma general la reñectancia en una determinada 
longitud de onda (esto se explica con mayor detalle en los capítulos 6 y 16). Puesto 
que el espectro de radiación puede subdividirse en distintos grupos, los sensores 
que toman estas imágenes recogen varias capas, una para cada uno de estos grupos. 
En lugar de almacenarse como un conjunto de capas separadas, es más frecuente 
que lo hagan en una única que contiene varias bandas, es decir, varios niveles 
distintos, cada uno de los cuales podría constituir por sí mismo una capa ráster. 

Se trata de una diferencia más de tipo formal, pero de cierta importancia, 
puesto que no todos los SIG están preparados para manejar capas ráster con 
independencia de su número de capas. Imágenes con una única banda, o tres, son 
habituales y soportadas en la mayoría de implementaciones, mientras que números 
mayores de bandas no se encuentran soportados en muchos programas. 

Todos estos conceptos se extenderán en el capítulo 6. 

5.3.2. Modelo vectorial 

El otro modelo principal de representación es el modelo vectorial. En este 
modelo, no existen unidades fundamentales que dividen la zona recogida, sino que 
se recoge la variabilidad y características de esta mediante entidades geométricas, 
para cada una de las cuales dichas características son constantes. La forma de 
estas entidades (su frontera), se codifica de modo explícito, a diferencia del modelo 
ráster, donde venía implícita en la propia estructura de la malla. 

Si el modelo ráster era similar al modelo conceptual de campos, el vectorial 
lo es al de entidades discretas, pues modeliza el espacio geográfico mediante una 
serie de primitivas geométricas que contienen los elementos más destacados de 
dicho espacio. Estas primitivas son de tres tipos: puntos, líneas y polígonos. 

3 acrónimo de picture element 
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Figura 5.8: Primitivas geométricas en el modelo de representación vectorial y ejemplos 
particulares de cada una de ellas con atributos asociados 


Utilizando puntos, líneas o polígonos, puede modelizarse el espacio geográfico 
si se asocia a estas geometrías una serie de valores definitorios. La componente 
espacial de la información queda así en la propia primitiva (recoge la forma, po- 
sición y otras propiedades espaciales), y la componente temática queda en dichos 
valores asociados (Figura 5.8). 

A la hora de definir las formas geométricas básicas, todas ellas pueden reducirse 
en última instancia a puntos. Así, las lineas son un conjunto de puntos interco- 
nectados en un determinado orden, y los polígonos son líneas cerradas, también 
expresables por tanto como una serie de puntos. Todo elemento del espacio geográ- 
fico queda definido, pues, por una serie de puntos que determinan sus propiedades 
espaciales y una serie de valores asociados. 

Una única entidad (para la cual existirá un único conjunto de valores asociados) 
puede contener varias primitivas. Así, en un mapa mundial en que cada entidad 
represente un país, y tal y como se ve en la figura 5.9, países como Canadá estarán 
representados por más de un polígono, pues no puede recogerse todo su territorio 
mediante uno único. Todos estos polígonos constituyen una única entidad, ya que 
todos perteneces al mismo país y tendrán el mismo conjunto de valores asociados. 

Otro caso particular en las capas de polígonos son aquellos polígonos con islas 
(huecos). En este caso, se registran de la misma forma que en el caso de varios 
polígonos disjuntos. Se recogen los propios huecos como polígonos independientes, 
pero recogiendo de algún modo también la circunstancia de que estos polígonos 
no se suman a los polígonos existentes en esa entidad, sino que se restan. Así es, 
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Figura 5.9: Casos particulares de polígonos: a) varios polígonos disjuntos en una misma 
entidad (en este caso, mismo país) , b) Polígonos con islas (huecos) . 


por ejemplo, para el caso del área total de polígonos de una única entidad, ya que 
el área del hueco debe ser restada de la total. 

En la figura anterior, vemos como Sudáfrica presenta esta situación, ya que 
dentro del territorio del país hay zonas aislada que no pertenece a Sudáfrica, como 
por ejemplo la que constituye el Reino de Lesotho. 

Como se muestra en la figura 5.10, el conjunto del territorio ocupado por Sudáfri- 
ca y las zonas interiores que no pertenecen al país no puede verse como un conjunto 
de polígonos sin más. Para representar Sudáfrica de forma aislada es necesario «res- 
tar» del polígono que engloba todo el territorio los polígonos respectivos a los países 
interiores. De no hacerlo así, un cálculo sencillo tal y como el del área de dicho país 
arrojará un resultado erróneo, pues considerará igualmente estas zonas interiores. 

En realidad, los huecos se registran como polígonos disjuntos que pertenecen a 
la entidad, aunque en lugar de representar un territorio que se añade, representan 
uno que se «quita». Una forma habitual de hacer esto es almacenar las coordenadas 
de los vértices de estos polígonos interiores en sentido inverso, de tal modo que 
su área es negativa. De esta forma, la suma total del área de los polígonos de la 
entidad es igual al área buscada 4 . 

Dentro de un SIG, una capa vectorial puede contener un único tipo de primitiva. 
Así, tenemos capas vectoriales de puntos, de líneas y de polígonos, respectivamente. 

4 La fórmula empleada para el cálculo del área de un polígono se expone en la página 253 
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Figura 5.10: Los huecos de un polígono han de considerarse como parte de este. 


La elección de uno u otro tipo de capa para registrar una variable o conjunto de 
ellas ha de ser función del tipo de fenómeno que se pretende modelizar con dicha 
capa o la precisión necesaria, entre otros factores. 

Por ejemplo, una capa de puntos puede representar un conjunto de ciudades, 
cada una de ellas definida como un único punto. Sin embargo, puede emplearse 
una capa de polígonos y no recoger una única coordenada (correspondiente, por 
ejemplo, al centro de la ciudad), sino el contorno o los límites administrativos de 
esta. Dependiendo del caso, será más apropiado elegir una u otra alternativa. 

De igual modo, la capa de vías representada en la figura 5.2 es una capa de 
líneas. Cada línea, como elemento teórico de ancho nulo, representa el eje de la vía. 
Si se requiere una mayor precisión en la definición de la superficie de rodadura de 
dichas vías, una capa de polígonos puede ser utilizada en lugar de una de líneas. 

Lo anterior tiene una evidente relación con los conceptos de escala y genera- 
lización que vimos en el capítulo 3. 

No debe pensarse que las capas vectoriales, sean del tipo que sean, se emplean 
únicamente para recoger fenómenos o elementos cuya forma coincide con la de las 
primitivas geométricas (es decir, puntos para recoger elementos puntuales, líneas 
para aquellos elementos con una dimensión mucho menor que la otra, y polígonos 
para el caso de superficies). Además de los ejemplos anteriores, debemos recordar 
que el modelo vectorial también sirve para representar campos y recoger variables 
tales como la elevación. 

Así, en los ejemplos de la figura 5.1 encontramos capas de puntos, lineas (curvas 
de nivel) y polígonos (TIN), todas ellas empleadas para representar la variable ele- 
vación. En ocasiones se emplean las primitivas para recoger objetos reales de forma 
similar, mientras que en otros casos sirven para plantear un modelo lógico y recoger 
variables que no se asemejan de modo alguno a las formas geométricas registradas. 

A propósito de la capa de puntos regulares, cabe pensar que es similar en 
concepto y forma a la malla ráster, ya que es regular. Sin embargo, existen dos 
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diferencias importantes: en primer lugar, en la capa de puntos hay zonas en blanco, 
de las que no sabemos su elevación, mientras que en la malla ráster las celdas tienen 
una superficie y cubren en su conjunto todo el espacio. En segundo lugar, si tenemos 
esa capa de puntos en un SIG, esta va a contener las coordenadas particulares de 
cada punto, ya que en sí las capas vectoriales no son regulares (pueden guardar 
alguna regularidad, pero no necesariamente), y por tanto es necesario, como hemos 
visto, registrar explícitamente sus coordenadas. De modo similar podríamos hacer 
una capa de polígonos cuadrados, pero seguiría sin ser una malla ráster, más aún 
si careciera de un elemento que veremos en breve: la topología. 

La componente temática en el modelo vectorial 

La forma en la que los modelos de representación separan las dos componentes 
de la información geográfica hemos visto que es bien distinta. En el modelo ráster 
se tiene un conjunto de valores (la componente temática), los cuales guardan una 
estructura dada, la cual por sí misma establece su disposición en el espacio (la 
componente espacial). En el vectorial, por su parte, la componente espacial se 
recoge explícitamente según una serie de puntos, la cual puede ser más o menos 
compleja en función de la complejidad de la entidad a representar o el detalle con 
que se recoja. A este conjunto de puntos se le relaciona después con una serie de 
valores, que son los que definen las propiedades de la entidad. 

Estos valores, los atributos, a diferencia del caso ráster, suelen ser múltiples. 
Por ejemplo, dada una capa vectorial de países, podemos recoger valores asociados 
a cada país tales como su superficie, su población, el Producto Interior Bruto, el 
nombre de su capital o el idioma que se habla. Todo este conjunto de valores se 
asocian a una única copia de la componente espacial, y esta no debe repetirse para 
recoger cada uno de esos parámetros. En el modelo ráster, si tenemos n capas 
distintas, en realidad estamos almacenando n veces la componente espacial. 

Por esta estructura particular, la componente temática se presta especialmente 
a almacenarse en una base de datos, siendo en la actualidad las más extendidas 
las denominadas bases de datos relaciónales. Estas bases de datos se enlazan a la 
componente espacial y permiten una serie de operaciones(ver capítulo 11) y un 
manejo ventajoso de los atributos. Existen, por tanto, dos realidades: la relativa 
a la componente geográfica y la base de datos que gestiona los atributos, la cual 
permite análisis y operaciones independientes, del mismo modo que si no existirá 
una localización asociada a dichos atributos. Estas realidades pueden estar muy 
separadas, gestionándose en aplicaciones distintas y almacenándose en ficheros 
diferentes, con lo cual existe una división formal mucho más acusada que en el caso 
de las capas ráster, que se asemejan más a unidades de información autocontenidas. 

En el caso de las capas ráster, no es necesario recurrir a una base de datos, y 
simplemente la representación del conjunto de valores de la variable en las distintas 
celdas sirve para el almacenamiento, análisis y manejo de la información. Como 
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indica [15] , esta forma de conectar las componentes espacial y temática es apta para 
el análisis, pero el manejo de los atributos requiere la presencia de una base de datos. 

El establecimiento de las bases de datos, su manejo y su implementación 
dentro de un SIG es un tema altamente complejo. La forma en que el manejo de 
la componente temática y la gestión de la base de datos se establecen, así como 
la imbricación de la una en la otra, es la materia exclusiva del capítulo 8, donde 
todos estos temas se desarrollarán con profundidad. 

Topología 

Un elemento particular del modelo de representación vectorial es la topología. 
En términos matemáticos la topología estudia las características de los objetos 
geométricos que no varían al aplicar una transformación topológica tal como, 
por ejemplo, una transformación afín. Si tomamos un mapa y lo distorsionamos, 
los ángulos, las superficies y las distancias se ven afectadas. Sin embargo, otras 
propiedades tales como la adyacencia entre elementos o las relaciones entre estos 
se conservan. Por ejemplo, si una ciudad está dentro de una determinada provincia 
en un determinado mapa, no existe forma de distorsionar esta para lograr que 
dicha ciudad se encuentre fuera de la provincia. 

En el ámbito de los SIG se entiende la topología desde un punto de vista menos 
estricto y más funcional. En general, se dice que una capa de información tiene 
topología si en ella se almacenan de algún modo las relaciones entre los distintos 
elementos que la componen. En caso contrario, la capa es de tipo puramente carto- 
gráfico, ya que los elementos que contiene no presentan relación entre sí, o al menos 
esta relación no está almacenada junto a la propia información de estos elementos. 

En una capa ráster, las relaciones topológicas vienen implícitas en el propio 
modelo ráster, y son ajenas a la información como tal, dependiendo de la estructura 
de la malla de datos en sí. En el modelo vectorial, sin embargo, se recoge la informa- 
ción relativa a cada elemento de forma individual, y si las relaciones existentes no 
se registran de modo explícito, no se tendrá posteriormente información sobre ellas. 

Disponer de topología en una capa vectorial es de gran importancia a la hora 
de llevar a cabo ciertos tipos de análisis, así como otros tales como la edición de los 
propios datos geográficos. La topología no aporta beneficio a la hora de representar 
una capa, pero sí a la hora de llevar a cabo análisis sobre ella [37]. 

En la figura 5.11 se puede observar la diferencia existente entre editar una 
capa de polígonos con topología y una sin ella. En el primer caso, la información 
contenida en la capa antes de su edición nos informa no solo de la forma de cada 
polígono, sino también del hecho de que ciertos polígonos comparten bordes comu- 
nes y de que el conjunto de ellos cubre el espacio de forma completa (constituyen 
una teselación). Así, al modificar un punto en uno de los polígonos, todos aquellos 
polígonos adyacentes que comparten dicho punto modifican también su perímetro. 
Las capacidades de edición implementadas en el Sistema de Información Geográ- 
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fica hacen uso de la información topológica a la hora de editar geometrías. En el 
segundo caso, sin embargo, esta información no existe, y no se pueden alterar los 
polígonos adyacentes, perdiéndose la teselación completa del espacio. 



Figura 5.11: Diferencias entre la edición (desplazamiento de un punto) no disponiendo 
de topología (a) o con ella (b) . 

La topología es en este caso un elemento que contribuye a la calidad de los datos, 
pues mantiene la coherencia espacial de estos y evita la aparición de elementos 
tales como polígonos de muy pequeño tamaño, frecuentes en la digitalización de 
entidades debido a las pequeñas imprecisiones que se presentan en el proceso, y 
que causan la presencia de falsos solapes entre polígonos. 

No obstante, no todos los SIG incorporan capacidades de manejo y análisis 
de capas vectoriales con topología, y son menos aún los que implementan capa- 
cidades para crear dicha topología. En general, estas han quedado reservadas a 
las aplicaciones de alta gama, y el manejo de información vectorial en los SIG de 
escritorio no incluye de forma general lo relativo a la topología. 

Otro ejemplo de proceso en el que se hace necesario el disponer de capas con to- 
pología es el análisis de redes (este se detalla en el capítulo 19.7). Un mero conjunto 
de elementos geométricos (líneas en este caso) , no nos da información sobre los posi- 
bles enlaces entre las vías que quedan representadas. Los puntos donde se cruzan dos 
vías pueden ser cruces o rotondas (es decir, puede pasarse de una vía a otra, existien- 
do conexión entre ellas), o bien pasos elevados o subterráneos donde una de las vías 
pasa por encima de la otra (y por tanto no existe comunicación entre ambas). Las 
circunstancias son muy distintas en función del tipo de cruce que exista, y por ello es 
imprescindible conocer esta información para efectuar un análisis de redes correcto. 

Otro elemento que no se puede recoger sin topología son las direcciones de 
circulación. Habrá vías que puedan recorrerse en ambos sentidos, mientras que 
habrá otras que solo permitan movimiento de tráfico en una dirección. Saber en 
qué dirección podemos recorrer una vía es vital para poder plantear cualquier tipo 
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de análisis, y esta es una información de la que no disponemos si nuestra red viaria 
no ha sido representada mediante un modelo con topología. 

Estas circunstancias se recogen de forma esquemática en la figura 5.12 




Figura 5.12: Capa de vías de comunicación sin topología (a) o con ella (b). Los puntos 
en este segundo caso indican conexiones entre vias, y son una representación visible de 
la topología existente. Las flechas indican la dirección de circulación y, al igual que sucede 
con las conexiones, solo están presentes si existe topología 

Aunque, como se ha mencionado, las capas ráster en cierta forma contienen 
información topológica (se conoce la relación de adyacencia entre las distintas 
celdas), esta es débil, y no suficiente para análisis complejos como el de redes 
donde existen distintos elementos como los mencionados cruces o las direcciones de 
circulación. Aparte de la inherente peor disposición del modelo de representación 
para recoger una entidad espacial tal como una red, el modelo ráster no es óptimo 
para recoger la necesaria información topológica al respecto. Existen algunos 
intentos de adaptarlo a estas circunstancias (véase, por ejemplo [38]), pero en 
general no se encuentran implementados de forma habitual. 

Modelo vectorial sin topología ( spaguetti ) 

El modelo de datos vectorial almacena la información geográfica mediante una 
serie de entidades geométricas (lineas, puntos, polígonos), y una información aso- 
ciada (los atributos). La forma en que estas geometrías se recogen es, no obstante, 
única, y en función del enfoque adoptado, permitirá el almacenamiento o no de 
propiedades topológicas relativas a dichas geometrías. Se tienen así submodelos 
de representación, cada uno de ellos con un esquema distinto de almacenamiento 
de los elementos individuales que constituyen una capa ráster. 

Con independencia del submodelo, en todo caso las entidades se recogen 
mediante las coordenadas de sus puntos, pues como ya se vio toda entidad es 
reducible a un conjunto de puntos. La diferencia estriba en la forma en que dichos 
puntos se asocian a la representación de una entidad dada. Para el caso de una capa 
de puntos, no existe diferencia alguna, pero en el caso de líneas o polígonos sí la hay. 

En el tipo más simple, se recogen únicamente las propiedades geométricas de 
cada entidad, almacenando para cada una de ellas el conjunto de puntos individuales 
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que la componen. Esto aporta toda la información necesaria sobre la entidad, pero 
deja de lado la topología. Algunas propiedades topológicas pueden calcularse, tales 
como saber si un punto esta contenido dentro de un polígono o si dos rectas se cruzan, 
pero para otras no se dispone de información suficiente. Así, aunque podamos saber 
si dos líneas se cruzan, no podemos saber si este cruce implica una conexión real entre 
ellas de forma que pueda pasarse de la una a la otra o no, como vimos en la figura 5.12. 

Esta forma de recoger las entidades vectoriales es similar a la que encontramos 
en un mapa clásico, en el cual podemos conocer la forma de un área dada o el 
recorrido que sigue una determinada carretera, pero no las relaciones existentes. 
Únicamente disponemos del trazo con el que se han dibujado estos elementos. Por 
esta razón, y como se ha dicho, un modelo vectorial sin topología es perfectamente 
válido para la representación de cualquier tipo de información en formato vectorial, 
pero no tanto para su análisis. 

El almacenamiento de entidades basado en una mera lista de coordenadas de 
cada entidad se conoce popularmente como spaghetti , pues si pensamos en una 
capa de lineas sin topología que se entrecruzan en el espacio, esta se asemejan en 
cierta forma a un caótico plato de spaguettis sin orden ni relación entre ellos. 

La mayor ventaja de este modelo es su simplicidad, razón por la cual es la 
habitual en muchos de los SIG más populares. Para muchos usuarios, es suficien- 
te trabajar con datos vectoriales sin topología, pues las labores frecuentes que 
desarrollan, tales como consultas (capítulo 11) o creación de mapas derivados, no 
requiere conocer las relaciones topológicas existentes. 

Gran parte de las operaciones que se desarrollan en un SIG no requieren 
topología, y por ello no es necesario asumir siempre el coste que implica trabajar 
con ella (mayor complejidad en general). Es por ello que incluso aquellos SIG que 
sí poseen la capacidad de trabajar con topología, también disponen de formas de 
trabajar sin ella, empleando datos que carecen de topología. Esto es así también 
debido a que mucha información disponible no incluye topología, ya que o bien 
esta no se incorporó en el momento de la digitalización, o bien el formato de fichero 
en el que se almacenó no soportaba la inclusión de topología. 

En otros casos, la propia naturaleza de la variable que recogemos puede requerir 
ser almacenada sin topología, o bien puede ser que no existan relaciones topoló- 
gicas que representar. Una capa de polígonos en las cuales se recojan las áreas 
de influencia de unos determinado fenómenos puntuales pueden perfectamente 
solaparse. No existe en este caso esa relación que hace que el conjunto de polígonos 
que las representan cubra la totalidad del espacio y cada punto pertenezca a una 
sola entidad. En este caso, un punto puede estar afectado por uno, varios o ninguno 
de dichos fenómenos puntuales, y por tanto pertenecer a una, varias o ninguna 
de las entidades poligonales que representan sus respectivas áreas de afección. Al 
modificar una de ellas (por ejemplo, si el fenómeno puntual que la origina varía 
su intensidad), las demás geometrías no deberían verse afectadas. No existe como 
tal una relación que deba recogerse en forma de topología. 
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Con topología 

La alternativa al modelo vectorial sin topología (el que denominábamos spa- 
guetti ) es el almacenamiento explícito de las relaciones topológicas, recogiendo 
las coordenadas de los puntos que constituyen cada entidad, pero no mediante 
una simple lista para cada una de ellas. Recogiendo de forma individual toda la 
información espacial correspondiente a cada entidad, la topología se pierde, pues no 
se considera al conjunto de entidades como un conjunto en el cual existen relaciones 
internas, sino como una simple colección de cosas. Para recoger la topología es 
necesario considerar todos los puntos que constituyen las entidades, y después 
formar las entidades a partir de ese todo de puntos, considerando en el proceso que 
un mismo punto puede pertenecer a varias entidades. Esto es lo que se denomina 
frecuentemente un diccionario de puntos, ya que contiene las definiciones de estos 
(sus coordenadas) y en base a ellos se construyen las distintas geometrías. 

Esta forma de considerar el conjunto de entidades evita, además, la redundancia 
en los datos. Por ejemplo, para el caso mostrado en la figura 5.11, y en caso de 
no tener topología, el punto que es movido está almacenado dos veces, una por 
cada polígono. Al desplazarlo, solo se modifica una copia de dicha coordenada, la 
que pertenece al polígono editado, mientras que la otra permanece en su lugar. 
Si se dispone de topología, este punto se almacena una única vez, y al desplazarse 
se modifican las fronteras de todos los elementos (lineas o polígonos, según el caso) 
cuya frontera incluye dicho punto. 

La denominación de diccionario de puntos que se mencionaba anteriormente es 
muy reveladora en este sentido. Si los puntos son como las palabras de un diccionario 
y los polígonos como frases o párrafos, basta pensar en lo poco práctico que sería es- 
cribir una frase en la que debiera definirse cada palabra al introducirla en dicha frase. 
Resulta mucho más adecuado (y ahorra esfuerzos al escritor), utilizar las palabras 
simplemente, y después definir estas en un diccionario en caso de que el lector no 
las conozca y necesite una referencia. Con el caso de los puntos sucede algo similar. 

Existen diversos modelos para almacenar tanto las propias geometrías como 
sus relaciones inherentes, dos de los cuales se muestran en la figura 5.13 mediante 
sendos ejemplos en los que se codifican polígonos y líneas. 

El primero de estos modelos es un modelo de carácter histórico denominado 
DIME ( Dual Independent Map Encoding ), desarrollado originalmente por el US 
Bureau of the Census, y posteriormente mejorado en el modelo TIGER, empleado 
para la digitalización de cartografía urbana. El segundo es el modelo arco-nodo, 
probablemente el más difundido y popular en la actualidad, aunque a este respecto 
los planteamientos existentes son muy variados. 

En este modelo existen dos unidades fundamentales: Los nodos, que son puntos 
donde se conectan varias líneas; y los arcos, que son lineas entre dos nodos. Estas 
líneas no han de ser rectas, ya que pueden contener en su recorrido vértices. Los 
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Figura 5.13: Dos modelos para representar la topología de líneas y polígonos, a) DIME, 
b) arco-nodo. 


vértices son en realidad los puntos que solo pertenecen a una entidad, mientras 
que los nodos pertenecen a varias de ellas. 

Una capa de líneas se describe como un conjunto de arcos y nodos, de forma 
que, atendiendo a los nodos como enlaces entre las líneas, se pueden conocer las 
relaciones entre ellas. En el caso de polígonos, estos se forman con conjuntos de 
arcos que delimitan las fronteras. Los polígonos que son adyacentes comparten 
uno o más arcos, quedando establecida así mediante ellos la relación topológica. 

En el caso del modelo DIME, sin embargo, vemos que cada linea recta entre dos 
puntos se trata como una unidad, es decir, que todos los vértices son considerados co- 
mo nodos y los arcos se componen siempre de una sola línea. El arco es en realidad un 
segmento. En ambos casos, no obstante, cada arco tiene un inicio y un final — y por 
tanto una dirección — , y puede definirse un lado derecho y otro izquierdo según se 
avanza en dicha dirección. Como puede verse, también en ambos modelos se recoge 
explícitamente qué polígono, en caso de haber alguno, se sitúa a cada lado del arco. 

La información que se recoge según estos modelos, vemos que se divide en 
bloques según los distintos niveles, desde los puntos, que han de recogerse en un 
diccionario de puntos (aunque este no queda reflejado en las tablas de la figura), 
pasando por los segmentos o arcos, y hasta los polígonos, definidos estos en base 
a los anteriores. 
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Con independencia del modelo, y sin entrar en más detalles, todos estos elemen- 
tos en conjunto sirven para recoger las relaciones existentes entre los elementos, de 
tal modo que pueden llevarse a cabo también aquellas operaciones que no dependen 
exclusivamente de la posición, sino asimismo de otra serie de propiedades. 

Dentro de los modelos existentes, encontramos asimismo variaciones en función 
de la tarea principal que se desee realizar. La eficiencia de cierto tipo de cálculos 
puede aumentarse notablemente si se elige un modelo de representación óptimo, 
como podemos ver si analizamos una de las operaciones más comunes: el cálculo 
de rutas óptimas entre dos puntos (los detalles sobre este cálculo se exponen en 
el capítulo 19, aquí por el momento únicamente mostraremos sus implicaciones 
en los modelos de representación). 

Para calcular la ruta óptima entre dos puntos dados de una red necesitamos 
conocer qué nodos de la red están conectados entre sí y por qué vías están conecta- 
dos, ya que las características de estas condicionan el movimiento. La información 
necesaria para este cálculo puede almacenarse perfectamente según un modelo 
arco-nodo como el que ya conocemos, pero considerando las particularidades del 
análisis que queremos realizar, existen otros modelos más apropiados. 

Por ejemplo, se puede tener en cuenta que los vértices de un nodo no tienen 
relevancia alguna. Si el tránsito se realiza entre dos nodos, a efectos del cálculo 
es indiferente que el tramo que los une tenga unos u otros vértices. Lo único que 
importa es saber que existe un tramo que los conecta y las características de ese 
tramo como, por ejemplo, el tiempo que cuesta recorrerlo o si conecta el nodo A con 
el B y el B con el A o solo lo hace en una de las direcciones anteriores. Por ello, en el 
caso del análisis de redes, la clave reside en almacenar de forma eficiente los nodos 
y las relaciones, pues estos son los elementos esenciales para efectuar los cálculos 

Algunos modelos empleados comúnmente para el almacenamiento de redes 
son los siguientes [35] : 

■ Matriz de incidencias arco-nodo 

■ Matriz de adyacencias nodo-nodo 

■ Listas de adyacencia 

■ Estrella directa e inversa 5 

La matriz de adyacencias nodo-nodo es sumamente sencilla, ya que simple- 
mente, para un número n de nodos, contiene una matriz de tamaño nxn, en la 
que cada elemento (i.j) indica la existencia o no de conexión entre los nodos i y j y 
la naturaleza de dicha conexión. Si el elemento es igual a cero indica que no existe 
posibilidad de desplazarse directamente del nodo i al nodo j. En caso contrario, el 
valor es igual a la propiedad que se desee recoger del tramo, por ejemplo el tiempo 
que se tarda en recorrer o la velocidad máxima a la que puede hacerse ese recorrido. 

La gran ventaja de este método es su gran sencillez, que deriva en sencillas 
implementaciones de los algoritmos correspondientes. 

5 Forward and reverse star 
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El método de estrella directa e inversa, por su parte, no es tan sencillo (una 
descripción algo más detallada puede encontrarse en [35]), pero, no obstante, es el 
más eficaz [39] , y sus tiempos de cálculo asociados son los menores de entre todos 
los anteriores. 

Más allá de los detalles particulares del modelo de representación, lo importante 
es tener presente que existen diversas formas de representar el dato geográfico, y 
que cada una de ellas tiene sus ventajas e inconvenientes en relación con la función 
que los datos hayan de desempeñar. 

TIN 

Hemos visto cómo una capa vectorial con topología nos sirve para modelizar 
ventajosamente elementos como una red de vías o una teselación del espacio en, por 
ejemplo, diferentes clases de usos de suelo. Además de esto, la incorporación de topo- 
logía sirve para mejorar la representación de campos mediante modelos vectoriales, 
permitiendo la aparición de modelos como los TIN, ya presentados con anterioridad. 

Un TIN [40] es una red formada por un conjunto de triángulos interconectados, 
cada uno de los cuales representa a una zona de características homogéneas en lo 
que a la variable estudiada respecta. Debido a esto, y como puede verse en la figura 
5.1, el número de triángulos varía según las características propias de la zona. 

En aquellos lugares en los que se dé una gran variación (en caso de recoger el 
relieve será en las áreas más abruptas), se utiliza un gran número de triángulos para 
recoger toda esa variabilidad. Cuando, por el contrario, los valores no varían de 
forma tan notable (zonas de relieve más llano), pueden emplearse menos triángulos. 
Puesto que cada triángulo está formado, como todo polígono, por puntos, podemos 
decir que se necesitan menos puntos para almacenar un terreno si este es llano que 
si este es muy abrupto. 

Cada triángulo tienen unas propiedades constantes, como corresponde al mo- 
delo vectorial. En particular, se considera habitualmente que todos los puntos 
dentro de un mismo triángulo constituyen un plano, con una pendiente y una 
orientación fija por tanto. 

La topología del modelo permite llevar a cabo análisis diversos sobre un TIN, ya 
que para cada triángulo se tiene conocimiento de cuáles son los adyacentes a este, y 
es en el análisis de dichos adyacentes en el que se basan gran parte de los algoritmos. 
Este análisis resulta sencillo de implementar en una capa ráster, pues la propia 
estructura de la misma informa directamente de las celdas circundantes, pero en el 
caso vectorial requiere la presencia de topología para plantear un esquema similar 
de operación. 

El análisis de los TIN no se desarrolla en detalle en este libro, pero resulta 
interesante recalcar en este punto que resulta posible de igual modo, y ello es debido 
a la presencia de topología en la propia estructura del modelo de representación. 

Las particularidades del TIN hacen que existan sub-modelos principales para 


104 


Sistemas de Información Geográfica 


almacenar el conjunto de triángulos, distintos del habitual arco-nodo, y pensados 
específicamente para responder a las necesidades que los TIN demandan como 
modelos vectoriales para representar variables continuas (en este sentido, es algo 
muy similar al caso que veíamos anteriormente de las redes) . Estos modelos son 
dos, principalmente: 

■ Almacenamiento de los triángulos uno por uno, cada uno con las coordenadas 
de todos sus tres puntos (coordenadas tridimensionales, no planas) y un 
código de identificación, y almacenamiento de los códigos de los triángulos 
adyacentes. 

■ Almacenamiento de los vértices y un código para cada uno de ellos, así como 
los códigos de los vértices a los que se encuentra conectado, en un orden 
establecido (horario o antihorario) . 

Más información sobre TIN puede encontrarse en [41]. La creación de TIN se 
trata con más detalle en el capítulo 17. 

5.3.3. Ráster vs vectorial 

Resulta obvio que las diferencias entre los modelos ráster y vectorial son muy no- 
tables, y que cada uno de ellos posee sus propias ventajas e inconvenientes. Desde los 
primeros tiempos de los SIG, ha existido una clara tendencia a separar ambas reali- 
dades en la implementación, de tal modo que los primeros SIG manejaban datos en 
formato ráster o bien en formato vectorial, pero no ambos. En cierta medida, parecía 
existir un conflicto entre ambos modelos, el cual ha perdurado aún hoy en algunos 
conceptos. Con el paso del tiempo, no obstante, la separación ráster-vectorial ha 
cambiado notablemente, y ha quedado claro que un SIG eficaz debe ser capaz de ma- 
nejar todo tipo datos geográficos con independencia del modelo de datos empleado. 

La comparación entre ambos modelos resulta necesaria para hacer un uso 
correcto de ellos, eligiendo en cada caso el más adecuado, y combinándolos de la 
manera óptima. Algunos aspectos a los cuales puede atenderse para comparar uno 
y otro modelo son los siguientes: 

■ Planteamiento. íntimamente ligados con los modelos conceptuales del es- 
pacio geográfico, los planteamientos de los modelos de representación ráster 
y vectorial son diferentes en su naturaleza. El modelo ráster hace más énfasis 
en aquella característica del espacio que analizamos ( qué y cómo), mientras 
que el modelo vectorial da prioridad a la localización de dicha característica 
{dónde) 

■ Precisión. El modelo ráster tiene su precisión limitada por el tamaño de 
celda. Las entidades menores que dicho tamaño de celda no pueden recogerse, 
y la variación espacial que sucede dentro del espacio de la celda tampoco. 
Asimismo, existe una imprecisión en las formas. El detalle con el que puede 
recogerse la forma de una entidad geográfica según el modelo vectorial es, 
en la práctica, ilimitado, mientras que, como puede verse en la imagen 5.14, 


Modelos para la información geográfica 


105 


el modelo ráster restringe las formas a ángulos rectos, ya que la unidad base 
es un cuadrado. 



Figura 5.14: Imprecisión de forma en el modelo de representación ráster. La división 
del espacio en unidades cuadradas impide la representación fiel de entidades tales como 
curvas como la mostrada en trazo rojo en la figura. 

El perímetro de una entidad geográfica estará compuesto por líneas horizon- 
tales o verticales exclusivamente y, además, su longitud y la superficie que 
encierra serán respectivamente múltiplos del tamaño de celda y el área de 
dicha celda. Esta es la principal razón por la cual, si el uso principal que se le 
va a dar a una capa es su representación gráfica, deba optarse por el modelo 
vectorial. En caso contrario, y salvo que la resolución sea suficientemente 
alta, los mapas creados mostraran la falta de resolución y podrán distinguirse 
las unidades mínimas de la capas ráster (al igual que pasa en una imagen 
digital pixelada ), teniendo un aspecto que no es el propio de un mapa, tal 
y como estamos acostumbrados a usarlo. 

El hecho de que dentro de una celda el valor de la variable recogida sea constan- 
te, da lugar a ambigüedades como la mostrada en la figura 5.15, donde una cel- 
da está ocupada por dos valores distintos, pero solo puede asignársele uno de 
ellos, debiendo establecerse algún criterio sistemático para llevar esto a cabo. 
Un hecho similar sucede en el ejemplo de la capa de vías. Algunas celdas 
son atravesadas por más de una vía, pero esa información se pierde, ya que 
el tamaño de celda no es suficiente para recogerla. La celda en cuestión 
aparece como celda de vía, pero no sabemos cuántas diferentes la atraviesan, 
ni tampoco si entre ellas están enlazadas o no. 

Hay que tener en cuenta, no obstante, que la precisión de la representación 
vectorial es, precisamente, de la representación como tal, es decir, del modelo, 
pero no del dato en sí que tenemos en dicho formato vectorial, el cual depende 
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Figura 5.15: Ambigüedad en la asignación de valores a una celda en una capa ráster, 
debido al tamaño de esta, que condiciona la precisión con la que puede recogerse la 
realidad existente sobre el terreno. 


de otros condicionantes tales como la escala de trabajo. Existe siempre 
incertidumbre en los datos, y el modelo de almacenamiento no excluye esta 
circunstancia. Los aspectos relativos a la calidad de los datos, tanto para 
datos ráster como vectoriales, se desarrollan en profundidad en el capítulo 7. 

■ Volumen de almacenamiento. El número de elementos a almacenar es, 
en general, muy superior en el caso del modelo ráster. Esto es así debido a 
que toda la superficie a recoger se divide en las mismas unidades, indepen- 
dientemente de la complejidad de la variable en cada punto o de la necesidad 
de estudiarla con mayor o menor detalle en unos puntos que en otros. Para 
variables que se conciban mejor según un modelo conceptual de entidades 
discretas, el modelo vectorial resulta más adecuado, ya que todas las zonas 
sin entidades no es necesario registrarlas de modo explícito, mientras que 
en el modelo ráster estas deben registrarse de igual modo que aquellas en las 
que sí existe información relevante. Los modelos de almacenamiento ráster 
que veremos en el siguiente punto solucionan en parte el problema de los 
grandes volúmenes de datos del modelo ráster, y son un elemento importante 
en la implementación eficiente del mismo. 

■ Complejidad. La regularidad y sistematicidad de las mallas ráster hacen 
sencillo el implementar algoritmos de análisis, muy especialmente aquellos 
que implican el uso combinado de varias capas. Cuando estas capas están 
en formato ráster y existe coincidencia entre sus mallas de celdas, el análisis 
conjunto de estas resulta inmediato. Por el contrario, la irregularidad espacial 
de las capas vectoriales hace que la implementación de los mismos algoritmos 
sea sumamente más compleja si se trabaja con estas capas. 

La sencillez de las capas ráster, tanto en su concepto como en su implementa- 
ción, se ve apoyada además por el hecho de que una capa ráster se puede aseme- 
jar a una matriz, y por tanto aplicar sobre ella una serie de herramientas y ele- 
mentos matemáticos en muchos casos bien conocidos y de fácil comprensión. 
Existe de igual forma una distinta complejidad en términos de proceso y 
cálculo. Los algoritmos sobre una base ráster pueden ser costosos en términos 
de tiempo por la necesidad de aplicarlos sobre un número muy elevado de cel- 
das y un gran volumen de datos (véase el punto anterior). Por el contrario, los 
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algoritmos sobre una base vectorial son costosos debido a que las operaciones 
matemáticas que implican son más complejas y requieren mayores número 
de cálculos (aunque los volúmenes manejados puedan también ser notables). 

Mas allá de las anteriores diferencias, a la hora de planificar un trabajo dentro 
de un SIG y elegir los datos que emplearemos y el modelo de representación ideal, lo 
importante es entender que no existe un modelo de representación idóneo de forma 
global, sino que esta idoneidad depende de muchos factores, como por ejemplo: 

■ Tipo de variable o fenómeno a recoger. Como ya sabemos, algunas 
variables, en función de su variabilidad y comportamiento espacial, son más 
adecuadas para el modelo vectorial, mientras que otras lo son para el modelo 
ráster. Por ejemplo, en el caso de variables que requieran una intensidad 
de muestreo distinta según la localización (variables que resulta interesan- 
te estudiar con más detalle en unos puntos que en otros) puede resultar 
más lógico recogerlas de forma vectorial, pues el modelo ráster implica una 
intensidad de muestreo constante a lo largo del área estudiada. 

■ Tipo de análisis o tarea a realizar sobre dicha variable. El uso que 
demos a una capa temática condiciona en gran medida el modelo de datos 
idóneo. Por ejemplo en el caso de una capa de elevaciones, su análisis se 
lleva mejor a cabo si esta información está recogida según el modelo ráster. 
Sin embargo, si el objetivo principal es la visualización de esa elevación 
en conjunto con otras variables, unas curvas de nivel pueden resultar más 
adecuadas, ya que, entre otras cosas, no interfieren tanto con otros elementos 
a la hora de diseñar un mapa con todas esas variables. 

■ Contexto de trabajo. Por ejemplo, si queremos trabajar con imágenes, 
esto nos condiciona al empleo de datos ráster, ya que resulta mucho más 
sencillo combinarlos con las imágenes, las cuales siempre se presentan como 
capas ráster. 

Así, en el desarrollo de un trabajo pueden aparecer circunstancias que hagan más 
adecuado utilizar el modelo ráster y otras en las que el modelo vectorial sea más idó- 
neo. En tal caso, deben combinarse ambas, pues es de esta forma como se obtendrán 
mejores resultados. Un usuario de SIG no debe limitarse a trabajar de forma general 
con un único modelo de datos, con independencia del tipo de tarea que desempeñe, 
pues en cualquier caso ambos modelos de datos pueden aportar alguna ventaja. 

Por último, es importante tener en cuenta que existen procedimientos para 
convertir entre los formatos ráster y vectorial, de forma que el disponer de datos en 
un modelo de representación particular no implica que debamos desarrollar nuestro 
trabajo sobre dichos datos directamente, sino que podemos efectuar previamente 
una conversión. Los capítulos 13 y 17 tratan estos temas en profundidad. 
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5.4. Modelos de almacenamiento 

Los modelos de almacenamiento son el ultimo escalón en la cadena de etapas 
distintas que llevan desde la realidad existente al conjunto de simples valores 
numéricos que almacenamos y manejamos en un SIG y que modelizan dicha realidad. 
Los modelos de representación definen una forma de recoger la realidad mediante 
unidades básicas (sean estas celdas en una malla, o bien primitivas geométricas 
definidas de una u otra manera), mientras que los modelos de almacenamiento 
plantean básicamente un esquema de cómo convertir dichas unidades en valores 
numéricos de la forma más eficiente. Es decir, cómo escribir dichos valores en un 
soporte digital o guardarlos en la memoria del ordenador de la mejor manera posible. 

Los modelos de almacenamiento deben atender principalmente a dos necesida- 
des básicas, que son las que definirán su idoneidad para cada tarea y tipo de dato: 

■ Minimizar el espacio ocupado por los datos. 

■ Maximizar la eficiencia de cálculo. 

La primera necesidad es especialmente importante, pues, como ya se ha dicho, 
los datos ráster son con frecuencia muy voluminosos. Un modelo de representación 
que minimice el tamaño de los datos, unido a un manejo óptimo de memoria, son 
requisitos de suma importancia para todo SIG que maneje datos ráster, máxime 
considerando los grandes volúmenes de datos que hoy en día se manejan, tales 
como los correspondientes a imágenes de alta resolución. 

La necesidad de maximizar la eficiencia de cálculo afecta principalmente a 
las representaciones vectoriales ya que en ellas las operaciones son complejas. La 
forma en que se estructuran los valores de cada entidad ha de minimizar el numero 
de accesos necesarios a estos, para de este modo obtener un mejor rendimiento 
en todas las operaciones de análisis. 

5.4.1. Modelos para representaciones ráster 

El principal problema relativo al almacenamiento de capas ráster se presenta 
para el conjunto de valores de las distintas celdas, que constituye la parte más 
voluminosa de la información recogida. Las coordenadas de las celdas de referencia 
o el tamaño de celda, por su escaso volumen, no conllevan dificultad alguna, y es en 
el almacenamiento de la malla de celdas en sí donde se encuentran las diferencias 
entre unos y otros modelos. 

La forma más inmediata de almacenar una capa ráster es simplemente alma- 
cenar sus valores uno a uno, en una estructura similar a la que la propia capa 
representa. Para el caso más habitual de capas con celdas cuadradas, sabemos 
que la malla de datos correspondiente se puede asimilar a una matriz, con las 
implicaciones que esto tiene a la hora de su manejo. Así, la forma más directa de 
recoger una malla de datos ráster es mediante una matriz de datos. Esta forma 
de almacenamiento tiene las siguiente ventajas [42]: 


Modelos para la información geográfica 


109 


■ Formato muy intuitivo. La mayoría de desarrolladores está familiarizado 
con el concepto de matriz y con las operaciones de calculo matricial que 
pueden aplicarse sobre estas. 

■ Sencillez en la implementación. Los lenguajes de programación soportan 
sin problemas el uso de matrices bidinrensionales y una serie de operaciones 
básicas sobre ellas. 

■ Estructura. Las mismas operaciones pueden aplicarse sobre todos los 
valores de la matriz de igual modo (todas las posiciones de la matriz son iguales 
desde este punto de vista), lo que simplifica la implementación de operaciones. 

■ Iterabilidad. Resulta igualmente sencillo recorrer la matriz e iterar sobre 
la misma, lo cual refuerza lo anterior y simplifica aún más la implementación 
de todo tipo de procesos. 

No obstante, el almacenamiento de todos los valores de forma idéntica ignora 
el hecho de que pueden existir valores similares en zonas concretas, que pueden 
recogerse de formas mucho más óptimas que una serie de números iguales. En otras 
palabras, y de modo similar a como ocurre con el propio modelo de representación 
ráster, la estructura regular que confiere las ventajas es también la responsable 
de la mayor parte de los inconvenientes. 

Como veremos en el capítulo 10, las zonas próximas entre sí (es decir, en el caso 
de una capa ráster, las celdas próximas entre sí), tienden a tener valores similares, 
en lo que se conoce como autocorrelación espacial. No considerar este hecho lleva al 
almacenamiento de información redundante, y ese es precisamente el principal pro- 
blema del almacenamiento directo de una capa ráster mediante una matriz. Alma- 
cenando explícitamente todos los valores de la malla se desperdicia en muchos casos 
una gran cantidad de espacio (sea este en memoria, disco u otro soporte cualquiera) . 

Podemos ver dos ejemplos claros de esto en las figuras 5.2 y 5.6. En la primera, 
existen únicamente dos valores: los correspondientes a las celdas sobre las que se 
sitúa una vía, o los correspondientes a las celdas donde estas no aparecen. Estos úl- 
timos ocupan la gran mayor parte de la capa, y lo hacen en bloque, de tal forma que 
almacenándolos individualmente se acaba teniendo una matriz de datos donde la 
practica totalidad de ellos son idénticos. Como es fácil de entender, este forma de pro- 
ceder no es la más adecuada, al menos en términos de volumen de almacenamiento. 

En la segunda imagen, las zonas que aparecen como consecuencia de la rotación 
de la imagen no contienen datos (esto es, contendrán el valor arbitrario que codifica 
la falta de datos). Estas zonas también constituyen grandes bloques de celdas 
contiguas, con lo que el almacenamiento de todos los valores también es una solución 
altamente redundante, especialmente en estas zonas fuera de la imagen como tal. 

La solución más habitual para considerar la redundancia de valores y lograr 
una compresión eficaz de los datos es la técnica denominada Run-Length Encoding. 
Esta técnica sencilla codifica una serie de n valores idénticos como un par de 
valores, el primero de los cuales representa el valor dicho que se repite n veces, y 
el segundo es el número de veces que se repite, esto es, n. 
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Así, si la primera fila de la capa de vías en formato ráster no aparece ninguna 
celda de vía, todas las celdas de dicha fila contendrán el valor con que se codifica 
la ausencia de estas (sea, por ejemplo, el valor 0). El almacenamiento directo de 
todos los valores de la fila requeriría tantos valores como columnas existan (sea 
n el ancho de la fila) , mientras que utilizando Run-Length Encoding, bastaría con 
almacenar el par (0, n). 

A la hora de tratar el conjunto de todas las celdas, se define un orden en el que 
recorrerla, denominado orden de barrido o de escaneo (Figura 5.16), de tal modo 
que la matriz bidimensional queda reducida a una cadena de valores, es decir, a un 
vector unidimensional. Los distintos trozos de esa cadena se van codificando según 
el esquema anterior, de tal modo que cuando aparecen muchos valores iguales 
consecutivos, estos pueden sustituirse ventajosamente por un único par de valores. 




Figura 5.16: Ordenes de escaneo. a) fila a fila sin retomo, b) fila a fila con retorno. 

La forma más sencilla de recorrer la imagen es hacerlo por filas, empezando por 
la fila superior y desplazándose de derecha a izquierda (Figura 5.16a). No obstante, 
el salto que se produce al final de cada fila suele implicar una discontinuidad en 
los valores. Invirtiendo la dirección del recorrido en cada fila, se tiene el orden 
mostrado en la figura 5.16b, el cual suele tener como resultado mayores niveles de 
compresión de datos, ya que la cadena resultante de recorrer la imagen contiene 
trozos generalmente de mayor tamaño. 

Un esquema de barrido más complejo es el basado en el denominado orden de 
Morton [43] . El orden de Morton (también conocido como orden Z ) , se basa en una 
curva de carácter recursivo, que recorre las celdas de la matriz siguiendo tramos 
en forma de Z, de ahí el nombre. En la primera iteración se divide el conjunto de 
celdas en cuatro bloques, los cuales se recorren siguiendo el antedicho recorrido 
en Z. Si los bloques contienen a su vez más de una celda, se siguen subdividiendo 
a su vez de forma idéntica, y así hasta que no pueda continuarse este proceso. 

La matriz que contiene los valores de orden de Morton (el orden en que se 
visita cada celda según el esquema anterior), se conoce como Matriz de Morton , 
la cual ya citamos por su importancia histórica en el capítulo 2. 

Un ejemplo de este orden de barrido aplicado a una pequeña matriz puede 
verse en la figura 5.17. 

Una estructura más avanzada son los denominados Quadtrees o árboles cuater- 
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Figura 5.17: Un ejemplo sencillo de barrido de una capa ráster según órdenes de Morton. 
Los valores en las celdas no indican los valores de la variable, sino el orden en que se visita 
dicha celda según este esquema de barrido 


narios. Estas estructuras también dividen el espacio en cuadrantes sucesivamente, 
pero lo hacen con más profundidad en aquellas zonas que así lo requieran por 
contener mayor número de elementos y necesitar mayor resolución. En el caso de 
una capa ráster, se requerirá más detalle siempre que todas las celdas dentro de un 
cuadrante no tengan el mismo valor. En el caso más extremo, se ha de descender 
hasta el nivel de una sola celda, pero puede ser que un bloque de celdas contiguas 
tenga el mismo valor, en cuyo caso el cuadrante correspondiente las engloba a 
todas y las define con dicho único valor, sin necesidad de subdividirse más. De este 
modo, se adapta el modelo de almacenamiento a la propia estructura de la capa 
y al comportamiento que en esta muestra la variable estudiada. 

Un ejemplo gráfico de un árbol cuaternario puede encontrarse en la figura 
5.18. Los arboles cuaternarios son empleados también en los índices espaciales , 
asociados a representaciones vectoriales, que veremos en 11.4.2 (de hecho, puede 
apreciarse que la figura anterior representa la aplicación de un árbol cuaternario a 
un conjunto de puntos, no a una capa ráster, aunque el concepto es el mismo y su 
aplicación a este segundo caso se realiza como ya se ha mencionado previamente) . 

Los quadtrees son estructuras complejas, y no profundizaremos más en su 
descripción dentro de este capítulo. Para el lector interesado, la definición original 
de esta estructura de datos puede encontrarse en [44] . 

Es importante reseñar que cuando la capa ráster contiene una información tal 
como una red viaria, la cual es susceptible de presentar valores idénticos en celdas 
contiguas, la codificación de tipo Run-Length — con cualquiera de los esquemas de 
barrido anteriores — es ventajosa. Sin embargo, no lo es tanto cuando se trabaja 
con otro tipo de variables. 

En una capa con valores de elevación, las celdas próximas tendrán valores 
parecidos pero no idénticos, con lo que no podrá sacarse partido a esta forma de 
almacenamiento. Más aún, en estos casos el volumen ocupado por los datos no solo 
no disminuye, sino que aumenta. Es por ello que los SIG han de implementar igual- 
mente la capacidad de poder trabajar con uno u otro modelo de almacenamiento 
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Figura 5.18: Ejemplo de un árbol cuaternario. En las zonas con más variabilidad (mayor 
densidad de puntos), los cuadrantes se subdividen hasta una profundidad mayor. La estruc- 
tura es tal que cada cuadrante tiene dentro a lo sumo un punto. (Tomado de Wikipedia) 


según los casos, bien sea por elección directa del usuario o tomándose de forma 
automática el que el propio sistema considere más adecuado en cada ocasión. 

Aunque el mayor problema de las capas ráster es su gran volumen, también 
existen diversas alternativas enfocadas a mejorar la velocidad de acceso a datos 
y el rendimiento de las operaciones sobre estas capas. Estas alternativas afectan 
a las imágenes con múltiples bandas, ya que estas, como dijimos, se recogen en un 
único fichero, en el cual se incorpora toda la información de las distintas bandas. 

La forma en la que las bandas se tratan dentro del fichero y el modo en que 
se ordenan los píxeles de las distintas bandas, ambas definen el esquema de alma- 
cenamiento, presentando cada uno de ellos una serie de ventajas de rendimiento 
en función de la actividad principal que se vaya a desarrollar con la imagen. Tres 
son los esquemas principales: 

■ Band Sequential (BSQ) . Los valores se almacenan por bandas. Es decir, prime- 
ro todos los píxeles de la banda 1, después los de la banda 2, y así sucesivamen- 
te. Este tipo de esquema da prioridad a la componente espacial, ya que permite 
acceder rápidamente a todo el espacio cubierto por una banda, puesto que los 
píxeles de dicha banda se encuentran almacenados en posiciones contiguas. 

■ Band Interleaved by Pixel (BIP). Los valores se almacenan ordenados por 
posiciones de pixel. Es decir, primero se almacenan todos los valores co- 
rrespondientes al pixel (0, O) 6 (en todas las bandas existentes), después los 
correspondientes al (0,1) 7 , y así sucesivamente. En caso de que lo que interese 
sea, para un pixel dado, conocer toda la información disponible (su valor en 

6 Es una terminología habitual empezar a contar en cero en lugar de en uno las coordenadas 
fila/columna de una imagen 

'Es habitual recorrer la imagen por filas, de forma que la coordenada (0,1) representa la 
primera fila y la segunda columna 
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todas las bandas), el esquema BIP es más ventajoso, ya que permite accesos 
rápidos a este tipo de información, sin necesidad de «saltar» de un valor a 
otro como sucedería en el caso del esquema BSQ. A nivel de acceso, se prima 
la información espectral sobre la espacial. 

■ Band Interleaved by Lines (BIL). Es un esquema intermedio en el que se 
recogen los valores por filas. Esto es, primero la fila 1 de la banda 1, luego 
la de la banda 2, y así sucesivamente. Posteriormente se recoge la fila 2 para 
todas las bandas, y de este modo hasta cubrir toda la imagen. Se trata de un 
esquema intermedio entre los anteriores, permitiendo un acceso rápido tanto 
a la información espacial como a la información espectral de las bandas. 

La figura 5.19 se muestra un ejemplo muy sencillo de los anteriores esque- 
mas. Para una imagen de 2 x 2 celdas y dos bandas, se recoge el orden en que se 
almacenaría capa valor según cada uno de dichos esquemas. 


BSQ BIP BIL 


1 

3 

5 

7 


1 

2 

5 

6 


1 

2 

3 

4 


2 

4 

6 

8 


5 

6 

7 

8 


3 

4 

7 

8 


Figura 5.19: Esquemas de almacenamiento para imágenes multibanda. Los números 
indican el orden en que se almacena cada valor. 

5.4.2. Modelos para representaciones vectoriales 

Al igual que para el modelo ráster, existen para el modelos vectorial diferentes 
alternativas a la hora de almacenar los elementos que componen una capa. En 
realidad, ya hemos visto dentro de este capítulo algo que se asemeja a un modelo de 
almacenamiento, pues los modelo topológicos como DIME o el modelo arco-nodo, 
o los detallados para el caso particular de las redes, todos son en realidad esquemas 
de almacenamiento para el conjunto de piezas que componen esa estructura 
topológica que se quiere almacenar. No obstante, también tienen algo de modelos 
de representación, pues existe variación en la forma en que conciben las partes de 
cada entidad (arcos entre dos nodos con o sin vértices intermedios, según el modelo). 

En realidad, la razón por la que se han presentado en una sección anterior es 
porque de ese modo ayudaban a comprender mejor la existencia o no de topología 
en una representación, y ese aspecto resulta más importante para el estudio de 
los SIG que los modelos de almacenamiento. Estos, como se ha dicho, están a un 
nivel más bajo y alejado del usuario. 

En general, los modelos de datos vectoriales no buscan tanto la disminución de 
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volumen de los datos como la obtención de una mayor eficacia en las operaciones 
y una simplificación de estas. Lógicamente, si los datos tienen un volumen menor, 
el tiempo que cualquier operación sobre ellos implica también ser menor. Aún 
así, la diferencia principal para este tipo de datos reside en la disminución de la 
complejidad en que estos se almacenan, disminuyendo las operaciones a realizar, 
así como la complejidad de la implementación de los correspondiente algoritmos 
(ambas habitualmente elevadas). 

Para mejorar el rendimiento de las operaciones que trabajan con datos vec- 
toriales, un factor clave es mejorar el acceso a los datos, de forma que, cuando 
se necesite acceder a unos datos concretos, estos puedan «encontrarse» de forma 
fácil. Por este motivo, un elemento importante en la representación de los datos 
vectoriales son los denominados índices espaciales. 

El concepto de índice cuando se habla de datos es similar al concepto de índice 
referido a un libro como este. Aquí tienes un ejemplo muy sencillo para que lo 
comprendas mejor: si vas al principio de este libro, puedes ver su índice y saber dónde 
empieza este capítulo, de forma que si estas interesado en modelos relacionados con 
la información geográfica, sabes rápidamente que es en este bloque de páginas donde 
debes buscar lo que te interesa. Si no existiera ese índice, tendrías que ir revisando 
todas las páginas hasta que llegaras al principio de capítulo y te dieras cuenta de que 
aquí es donde está lo que buscas. De igual modo, si vas al final de este libro y buscas 
el término índices espaciales , verás que aparece esta página junto con otras en las 
que aparece dicho término. Si no tuvieras ese índice, tendrías que revisar palabra 
por palabra para saber en qué partes de este libro se habla de índices espaciales. 

Estos sencillos ejemplos muestran situaciones similares a las que aparecen en el 
uso habitual de un SIG, en las cuales trabajamos sobre una parte del total de los da- 
tos. Igual que buscamos un capítulo o un único término, podemos querer, por ejem- 
plo, todas las entidades de una capa que están en una zona particular del espacio. 
Disponer de un índice acelera el proceso de localizar esas entidades que nos interesan. 
Por trabajar con información espacial, tales índices se denominan índices espaciales. 

Muchos de los procesos que veremos en la parte dedicada al análisis necesitan 
este tipo de índices para poder ejecutarse con un rendimiento adecuado. A medida 
que veamos estos procesos, se comprenderá mejor por qué la existencia de índices 
espaciales resulta necesaria e incluso imprescindible cuando disponemos de datos 
de gran volumen. En el capítulo 11 veremos información más detallada sobre la 
utilidad de los índices espaciales, ya que estos son vitales para la realización de 
consultas espaciales, que son tratadas en dicho capítulo. 

Como ya hemos dicho, el objetivo de este tipo de estructuras para representar 
los datos espaciales no es disminuir el tamaño, sino mejorar el rendimiento de las 
operaciones sobre ellos. De hecho, y al contrario que en el caso de los modelos de 
representación ráster, en este caso no disminuye el espacio que ocupan los datos, 
sino todo lo contrario, ya que este aumenta. Un índice espacial es información 
adicional que incrementa la utilidad de dichos datos. Exactamente del mismo modo 
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que el índice de este libro, que no sustituye al texto que ahora mismo estas leyendo, 
sino que se añade a este y te ayuda a manejarte a través de él y sacarle más partido. 

La creación del índice espacial supone la creación de una estructura espacial 
en la cual se contienen objetos más simples que las propias entidades geométricas, 
estructuradas a su vez de forma también más sencilla que recogiendo sus coorde- 
nadas, y con un orden característico. Como hemos dicho, este índice espacial no 
sustituye al dato espacial, sino que lo complementa, optimizando la búsqueda de 
información dentro de este. 

Existen dos enfoques principales para los índices espaciales: continuos y dis- 
cretos [45] . Los continuos utilizan las coordenadas mismas de las entidades, sim- 
plificando la forma de estas, mientras que en los discretos la simplificación se 
aplica al espacio, discretizando este. En ambos, las entidades que se emplean son 
rectangulares en la mayoría de los casos. La figura 5.20 muestra la aproximación 
de una geometría poligonal que se obtiene en ambos tipos de modelos. 


b) 


Figura 5.20: Aproximación continua (a) y discreta (b) para un índice espacial. 

En el caso continuo, se sustituye toda la complejidad del polígono por simple- 
mente cuatro puntos: aquellos que conforman el rectángulo dentro del que este 
se inscribe. En el caso discreto, se reduce el polígono a unas cuantas celdas de una 
malla. Realizar comprobaciones sobre estas estructuras resulta mucho más sencillo, 
y por ello se emplean para realizar aproximaciones que simplifican las operaciones 8 . 

Supongamos que utilizamos un índice espacial del primer tipo y queremos 
saber qué polígonos de una capa se intersecan con otro dado. Para comprobar qué 
polígonos se intersecan con este, en primer lugar podemos comprobar los solapes 
existentes entre sus rectángulos. Si los rectángulos no se solapan, es inmediato ver 
que los polígonos tampoco, con lo que no es necesario ya operar con ellos. Ver si 
dos rectángulos se solapan es casi inmediato, mientras que esta misma operación 
para polígonos complejos requiere un numero mucho mayor de operaciones. 

Debido al uso de rectángulos como elementos básicos, las estructuras que se em- 
plean están específicamente diseñadas para contener o bien rectángulos (en el caso 
de entidades de líneas o de polígonos) o puntos (en el caso de entidades puntuales). 
Estas estructuras no son nuevas para nosotros, ya que hemos visto algunas de ellas 

8 Este proceso, conocido como filtrado y refinamiento, lo veremos en detalle en el capítulo 1 1 
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en este mismo capítulo. Por ejemplo, para el caso de una aproximación continua 
sobre una capa de puntos, los arboles cuaternarios ( quadtrees ) son una estructura 
de datos adecuada. Esta aplicación ya la vimos, de hecho, en la figura 5.18. 

Como seguramente ya hayas advertido, los enfoques continuo y discreto se 
corresponden a primera vista con las ideas correspondientes a los modelos de datos 
ráster y vectorial (aunque los índices espaciales de los que estamos hablando son pa- 
ra capas vectoriales). Es por ello que las estructuras que hemos visto para el almace- 
namiento de datos ráster pueden utilizarse también para recoger las distintas celdas 
de un índice espacial discreto. Así, la división en celdas hace necesario un orden de 
escaneo. El orden de Morton que ya conocemos se aplica en este caso, entre otros. 

Una vez más, las estructuras de datos de todos estos índices espaciales suponen 
un elemento demasiado especifico para los contenidos de este libro, por lo que no 
se profundizará en su teoría. No obstante, estos son numerosos, ya que se trata 
de un área muy desarrollada. Referencias como [46] aportan descripciones más 
extensas para el lector interesado. 

En caso de querer profundizar en los aspectos más técnicos de la representación 
del dato geográfico en general, tanto en formato ráster como vectorial, [47] ofrece 
información muy extensa al respecto. 


5.5. Resumen 

El proceso de almacenar la realidad y reducirla a un conjunto de valores numé- 
ricos manejables por un ordenador implica tres etapas fundamentales: creación de 
un modelo conceptual, adopción de un modelo de representación y codificación del 
anterior según un modelo de almacenamiento. Estos procesos dan lugar a la crea- 
ción de las denominada capas geográficas, unidades fundamentales de información 
dentro de un SIG. 

Dos son los modelos conceptuales más importantes: campos y entidades discre- 
tas. Estos a su vez se identifican en líneas generales con los dos principales modelos 
de representación: ráster y vectorial. 

En el modelo ráster el espacio se divide sistemáticamente en unidades mínimas 
denominadas celdas, habitualmente de forma cuadrada. En el modelo vectorial 
se almacenan las distintas entidades geográficas a través de las coordenadas de 
los puntos que las componen. El concepto de topología es importante en el modelo 
vectorial, y en función de la forma en que se recojan las coordenadas de cada 
entidad, se almacenará o no la información topológica. El modelo arco-nodo es 
el más habitual para representar la topología. 

La ultima etapa es la que conlleva el almacenamiento de los modelos de repre- 
sentación, convirtiendo los elementos base de estos en valores numéricos manejables 
por el ordenador. Cada modelo de representación tiene sus particulares modelos de 
almacenamiento, los cuales tratan de maximizar el rendimiento de las operaciones 


realizadas sobre los datos espaciales, al tiempo que reducen el espacio que dichos 
datos ocupan. 
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Capítulo 6 


Fuentes principales de datos espaciales 


Una vez conocemos los modelos de representación y sabemos cómo almacenar la infor- 
mación geográfica, es momento de estudiar los distintos métodos que nos permiten llevar 
a la práctica el proceso de creación del dato geográfico, y los orígenes desde los que estos se 
generan. En este capitulo analizaremos las principales fuentes existentes, sus fundamentos 
y características, y cómo son los datos que se obtienen a partir de ellas. 

Para seguir el contenido de este capitulo, es importante tener una buena comprensión 
de todo lo descrito en el capitulo 5, en especial lo relativo a modelos de representación. 


6.1. Introducción 

El origen de los datos con los que trabajamos en un SIG puede ser sumamente 
variado y presentarse asimismo en formas diversas. La metodología seguida en la 
recolección de datos condiciona directamente la forma en que estos datos llegan a 
nosotros, y por tanto el uso que les podemos dar dentro de un SIG o las operaciones 
que debemos realizar con ellos de cara a poder adaptarlos para la realización de 
un trabajo concreto. 

No hace tanto tiempo, toda la información que se manejaba dentro de un SIG 
tenía su origen en un mapa en papel, el cual debía prepararse para adaptarse a la 
naturaleza propia del SIG. El desarrollo de los SIG ya había comenzado a dar sus 
frutos y se obtenían los primeros programas, pero eran necesarios datos para utili- 
zarlos. Sin embargo, los datos geográficos de los que se disponía no se encontraban 
en formato digital, por lo que no eran adecuados para su uso dentro de un SIG. 

Una tarea básica en esos tiempos era la digitalización de cartografía, es decir, 
convertir los datos geográficos en formato impreso en datos en formato digital 
que un SIG pudiera manejar. La disponibilidad de datos digitales era baja, pero, 
como resulta lógico pensar, sí que existía una gran cantidad de datos geográficos 
en otros formatos tales como mapas, cartas de navegación, fotografías aéreas, etc. 
La tecnología ha ido avanzando y ya se producen datos directamente en formato 
digital, considerando específicamente la existencia de los SIG como herramientas 
básicas de manejo de datos geográficos. No obstante, los datos en formato impreso, 
así como las técnicas que se emplearon en su creación, siguen siendo válidas, y 
sirven igualmente para crear datos geográficos que podemos emplear en un SIG. 

Hoy en día, la situación es bien distinta a la de aquellos primeros tiempos, 
y puede afirmarse que los orígenes a partir de los cuales se generan los datos 
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geográficos son muy diversos. Esto es así porque aúnan técnicas recientes y más 
adaptadas al entorno de los SIG con métodos clásicos que, no obstante, no han 
perdido su vigencia y valor. En la actualidad, la recolección de datos geográficos es 
un ámbito complejo con muchas alternativas, las cuales deben integrarse dentro de 
un SIG para permitir que este despliegue todo su potencial sobre dichos datos. Todo 
este conjunto de técnicas de adquisición de datos conforman un amplio abanico de 
posibilidades de las cuales el usuario de SIG debe nutrirse para trabajar siempre en 
las mejores condiciones posibles, maximizando la precisión y alcance de su trabajo. 

Integrar dentro del trabajo con un SIG todas las fuentes de datos disponibles es 
una tarea que requiere un conocimiento detallado de estas, con objeto de poder esta- 
blecer la mejor manera de combinarlas, y elegir en cada caso la mejor opción de las 
disponibles. A lo largo de este capítulo veremos las principales técnicas existentes pa- 
ra la creación de datos geográficos en un formato apto para su uso en un SIG, centrán- 
donos en los pormenores de proceso y las particularidades de los datos generados en 
cada caso. Para ello, veremos todo el conjunto de fuentes de las cuales pueden prove- 
nir los datos con los que trabajamos en un SIG, desde las más modernas hasta las más 
antiguas, así como las metodologías que permiten convertir las formas no digitales 
en datos aptos para su uso en dicho SIG. El objetivo es que, al final del capítulo, se co- 
nozcan con detalle todas las formas en las que los datos geográficos pueden presentar- 
se, se entiendan estas completamente con independencia de su origen, y se sepan uti- 
lizar y combinar todas las fuentes de datos, extrayendo lo mejor de cada una de ellas. 


6.2. Datos digitales y datos analógicos 

La principal diferencia que se presenta desde la aparición de los SIG es la 
necesidad de utilizar datos digitales. Un SIG implica una aplicación informática, 
y esta se alimenta en última instancia exclusivamente de datos digitales. Esta 
es la razón por la que debemos alimentar nuestro SIG con una serie de valores 
numéricos, y llegar a ellos a partir de la realidad que se pretende modelizar implica 
toda una serie de etapas, las cuales ya vimos con detalle en el capítulo 5 

Gran parte de los datos geográficos que se producen actualmente son en formato 
digital. Otros, a pesar de producirse hoy en día, no lo son directamente. Y junto 
a estos tenemos, como ya sabemos, todos los datos (que no son pocos) generados 
con anterioridad y que se presentan en diversas formas. Pero si deseamos trabajar 
con ellos en un SIG, de un modo u otro todos habrán de acabar siendo digitales. 

Los datos geográficos digitales tienen una serie de ventajas frente a los analó- 
gicos (además del mero hecho de que podemos incorporarlos a nuestro SIG), y 
suponen, como sucede en muchos otros campos, un salto cualitativo importante. 
Entender las ventajas frente a los datos analógicos ayuda a comprender un poco 
más la importancia de los SIG y la relevancia que cobran en el manejo de los datos 
geográficos. Estas ventajas pueden resumirse en las siguientes: 
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■ Sencillez de actualización. La cartografía digital es editable, y esto sim- 
plifica enormemente la introducción cambios. Si en una capa con información 
catastral cambia la frontera de una parcela, basta modificar esta frontera. En 
un mapa analógico habría que rehacer todo el mapa y volver a imprimirse. 
Además, y gracias a la división en capas, pueden actualizarse a distintos 
ritmos las distintas variables, pues son independientes y pueden modificarse 
por separado. 

Haciendo una analogía con el mundo editorial, piénsese en un diario impreso, 
con una única edición al día, en la que se ha de esperar al día siguiente para 
introducir todas las noticias que se vayan produciendo durante esa misma 
jornada. En su equivalente digital, la información se actualiza prácticamente 
en tiempo real, y podemos conocer las noticias mucho antes, pues es más 
sencillo actualizar esa página que volver a poner la imprenta en marcha. 

Es asimismo muy importante el hecho de que, gracias a los sistemas que 
centralizan el acceso a los datos, esta edición y actualización de datos pueden 
hacerla varias personas de modo concurrente. Esto no resulta posible en el 
caso de cartografía impresa, donde frecuentemente se encuentra el problema 
de que una cartografía de uso interno en una organización (por ejemplo, 
un ayuntamiento que guarda un inventario de su mobiliario urbano) ha 
sido editada por varias personas (el operario que sustituye un elemento de 
ese mobiliario luego lo registra en su inventario, y en un instante distinto 
otro operario puede añadir en su propio mapa la localización de un nuevo 
elemento añadido), siendo necesario después unir todas las modificaciones, 
lo cual no siempre resulta sencillo o incluso posible. 

Si varias personas trabajan con cartografía impresa de una zona, cada una 
de ellas tendrá su propio mapa. Con la cartografía digital, todos pueden 
obtener la cartografía de un repositorio central, de tal modo que si la editan, 
están editando una única versión, y no es necesario después poner en común 
todas sus aportaciones para crear una nueva cartografía actualizada. 

■ Facilidad de distribución. Resulta más sencillo y menos costoso distribuir 
cartografía digital que analógica, ya que esto se puede hacer rápidamente 
por Internet, por ejemplo. Volviendo al ejemplo del diario, las noticias se 
actualizan y se ponen en Internet, de donde cada lector las descarga de in- 
mediato. El diario impreso requiere una cadena de distribución más costosa, 
desde la imprenta hasta el punto de venta. 

■ Espacio de almacenamiento. Se generan actualmente ingentes volúme- 
nes de datos que además, y gracias a que son más fáciles de actualizar, se 
producen con una frecuencia mucho mayor. No obstante, un soporte digital 
puede almacenar una enorme cantidad de estos ocupando una fracción del 
espacio físico. En un ordenador dotado de una buena capacidad de almace- 
namiento caben los contenidos de una cartoteca y los de la hemeroteca de 
ese diario del que hablamos. Las mismas cartoteca y hemeroteca en formato 
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impreso requieren edificios enteros. 

■ Facilidad y precisión de análisis. Como ya veremos en la parte correspon- 
diente, el salto cualitativo que se da en el campo del análisis es enorme. Pode- 
mos hacer con los datos geográficos digitales cosas que no eran posibles con 
los analógicos y, mejor aún, podemos automatizar estos análisis. Asimismo, 
la precisión es mayor, ya que depende únicamente de los datos y la precisión 
intrínseca de estos, pero no de la operación de análisis (piénsese en un mapa 
impreso y una serie de operarios midiendo la longitud de un río sobre él. Es 
probable que lleguen a resultados similares pero no idénticos. Con cartografía 
digital, cualquier operario, y en cualquier SIG — suponiendo que implemen- 
tan todos las mismas fórmulas — llegaría al mismo resultado exacto). 

■ Facilidad de mantenimiento. Aunque no se introduzcan modificaciones 
y no se actualicen los datos, el formato digital hace más fácil su conservación. 
La degradación del soporte no degrada directamente el dato en sí, haciéndole 
perder calidad. La degradación del soporte analógico (el papel), sí que lo 
hace. Además, los datos digitales pueden replicarse con suma facilidad, por 
lo que su persistencia está garantizada en mayor medida y a un menor coste 
que la de los datos analógicos. 

Así pues, disponemos para nuestro trabajo en nuestro SIG de datos analógicos 
y datos digitales, siendo estos últimos los que necesitamos en última instancia, 
y que presentan las ventajas anteriormente descritas frente a los primeros. En 
las siguientes secciones, veremos con detalle todos los distintos tipos de datos 
geográficos, tanto digitales como analógicos, la forma en que se obtienen, sus 
características, cómo se incorporan a un SIG, y en general todo aquello que resulte 
de interés para una mejor comprensión y uso posterior de los mismos. 


6.3. Fuentes primarias y fuentes secundarias 

Como hemos visto, algunos datos que utilizamos en un SIG son de tipo analó- 
gico, mientras que otros son de tipo digital. En algunos casos (generalmente en los 
analógicos), estos datos no han sido tomados pensando en su utilización en un SIG, 
y nos van a servir de base para obtener otros que sí pueden emplearse directamente 
dentro de un SIG. Por el contrario, existen otros datos que ya han sido recogidos con- 
siderando su utilización dentro de un Sistema de Información Geográfica, y la forma 
en la que se presentan ya es adecuada para incorporarlos en este y trabajar con ellos. 

En base a lo anterior, se define una forma distinta de clasificar los datos 
espaciales con los que trabajamos en un SIG: datos primarios (o procedentes de una 
fuente primaria) y datos secundarios (o procedentes de una fuente secundaria) [48] . 

Los datos primarios son aquellos que podemos emplear en un SIG y que, en su 
forma original, ya son susceptibles de ser sometidos a las operaciones de manejo y 
análisis que incorporan los SIG. En este grupo encontramos las imágenes digitales o 
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los datos obtenidos con GPS, todos ellos recogidos ya en origen de forma adecuada 
para su empleo directo en un SIG. 

Por su parte, los datos secundarios derivan de algún otro tipo de dato previo, el 
cual no es adecuado para su empleo en un SIG. Entre estos incluimos las versiones 
digitales de los mapas clásicos (veremos en breve cómo se lleva a cabo esa conversión 
de un documento analógico a uno digital), así como los datos procedentes de un 
muestreo o levantamiento tradicional. Otros provenientes de cartografía impresa, 
tales como capas de elevaciones, también se incluyen en en este grupo. 

Al desarrollar las fuentes de datos en este capítulo, se tratarán tanto fuentes 
primarias como secundarias, y en el caso de estas últimas se tratarán a su vez las 
formas en las que a partir de estas pueden derivarse datos digitales que puedan 
ya ser incorporados a un SIG. 


6.4. Teledetección 

La primera fuente de datos que trataremos en este capítulo es la teledetección. 
Entendemos por teledetección el estudio y medida de las características de una 
serie de objetos (en nuestro caso elementos de la superficie terrestre) sin que exista 
contacto físico [49, 50, 51]. Para ello, se miden las perturbaciones que el objeto 
provoca en su entorno, principalmente las de tipo electromagnético. 

Tradicionalmente, la teledetección se ha estudiado como una materia comple- 
mentaria pero en cierto modo separada de los Sistemas de Información Geográfica. 
Ello es debido principalmente a que se trata de una materia muy extensa cuyo 
desarrollo se ha producido en cierta parte de forma ajena al de los SIG. No obstante, 
a medida que ambos campos se han ido desarrollando, la convergencia entre SIG 
y teledetección se ha ido haciendo cada vez más evidente. No solo las aplicaciones 
SIG incorporan elementos para el manejo, tratamiento y análisis de datos proce- 
dentes de la teledetección, sino que las formulaciones de ambos ámbitos contienen 
elementos similares. 

La teledetección es hoy en día un elemento clave para la formación en SIG, y 
como tal debe incluirse en un libro como este. Los bloques tradicionales en los que 
se divide el temario fundamental de la teledetección no incorporan únicamente 
el registro de la información y la creación de los datos, sino también su proceso 
posterior, interpretación y tratamiento. Este último no se trata, sin embargo, 
en este capítulo, sino en la parte dedicada al análisis, integrado junto con otras 
formulaciones similares para proceso de imágenes. 

La teledetección es, como decimos, una fuente de datos primordial en los SIG, 
y el verdadero aprovechamiento de los productos actuales de la teledetección 
solo se da con el concurso de los SIG y sus capacidades de análisis y manejo de 
datos. No obstante, y atendiendo a la definición dada, los procesos de teledetección 
aplicados al ámbito cartográfico y el análisis espacial se remontan a tiempo atrás, 
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concretamente a la mitad del siglo XIX. Fue entonces cuando se tomaron las 
primeras fotografías aéreas uniendo el recién desarrollado campo de la fotografía 
junto con la utilización de globos aerostáticos como medio para situar el aparato 
fotográfico a una altura suficiente que permitiera obtener las imágenes. 

Las fotografías aéreas fueron el primer producto de la teledetección, pero hoy 
en día existen otros que, basados en esa misma idea de registro de información, 
pueden ser empleados como fuentes de datos espaciales dentro de un SIG. Para 
comprenderlos, estudiemos algo más en detalle los elementos del proceso de te- 
ledetección, los cuales se representan de forma esquemática en la figura 6.1. Estos 
elementos son los siguientes: 



Figura 6.1: Esquema de un sistema de teledetección. 

■ Una fuente de radiación (A). Puede ser de origen natural o artificial. La 
radiación emitida por dicha fuente llega al terreno y sufre una perturbación 
causada por los elementos de este, siendo esta perturbación el objeto de 
estudio de la teledetección. Los propios objetos pueden ser también emisores 
ellos mismos de radiación. 

■ Unos objetos (B) que interaccionan con la radiación o la emiten, 
según lo anterior. 

■ U na atmósfera ( C) por la que se desplaza la radiación, tanto desde la fuente 
hasta el objeto como desde el objeto hasta el receptor. La atmósfera también 
interactúa con la radiación, introduciendo igualmente perturbaciones en ella. 

■ Un receptor (D) que recoge la radiación una vez esta ha sido pertur- 
bada o emitida por los objetos. El receptor va a generar como producto final 
una imagen (en términos de un SIG, una capa ráster), en cuyas celdas o 
píxeles se va a contener un valor que indica la intensidad de la radiación. 
Estos valores son valores enteros que indican el nivel de dicha radiación 
dentro de una escala definida (habitualmente valores entre 1 y 256), y se 
conocen dentro del ámbito de la teledetección como Niveles Digitales. 

A lo largo de este apartado veremos con detalle estos elementos. Para estudiar 
los dos primeros, estudiaremos los fundamentos físicos relativos a la radiación y 
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a la la interacción entre esta y la materia, mientras que para el estudio del sistema 
receptor analizaremos los elementos de este en dos componentes por separado: 
sensores y plataformas. 

La interacción de la atmósfera interesa de cara a eliminar su efecto, ya que 
lo que resulta de interés en general son los objetos en la superficie terrestre, no 
la atmósfera como tal. Eliminar esta influencia de la atmósfera es parte de los 
procesos posteriores que se realizan con la imagen y que incluyen también, como se 
mencionó anteriormente, la interpretación y otros procedimientos diversos sobre 
esta. Todos ellos no son tratados en este capítulo sino, tal y como se dijo, en un 
capítulo independiente dentro de la parte de procesos. 

6.4.1. Fundamentos físicos 

Es necesario conocer los conceptos fundamentales sobre la radiación y su 
interacción con la materia (los objetos de la superficie terrestre) para poder en- 
tender cómo, utilizando la radiación de una fuente dada, se crea una imagen como 
resultado final en un proceso de teledetección. 

La radiación electromagnética 

La radiación electromagnética es una de las cuatro fuerzas fundamentales de 
la naturaleza 1 y deriva del campo electromagnético, el cual es ejercido por las par- 
tículas cargadas eléctricamente. Para explicar esta existen dos modelos conocidos 
como modelo ondulatorio y modelo de partículas. Según el primero, que será en el 
que profundicemos algo más, la radiación electromagnética es producto de las al- 
teraciones en los campos eléctrico y magnético, que generan dos ondas ortogonales 
entre sí, correspondientes a cada uno de los campos anteriores (Figura 6.2). 

r 

A 
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Figura 6.2: Ondas correspondientes a los campos magnético y eléctrico, ortogonales 
entre sí (Tomado de Wikipedia). 

Estas ondas se desplazan a a la velocidad de la luz, y se pueden describir con 
los parámetros habituales, tales como la longitud de onda o la frecuencia 2 . Una 

1 Las otras tres son la gravitatoria, la interacción nuclear débil y la interacción nuclear fuerte 

2 Se supone que el lector tiene cierta familiaridad con estos conceptos físicos básicos. En caso 
contrario, una referencia que puede encontrarse en la red es [52] 
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mayor longitud de onda (y, por tanto una menor frecuencia) tiene asociada una 
mayor energía de la radiación. 

La radiación electromagnética puede cubrir de forma continua todo un amplio 
rango de valores de longitudes de onda. Este rango se conoce como espectro electro- 
magnético. Pese a la continuidad de sus valores, es habitual agruparlos en regiones, 
discretizando la amplitud del espectro, ya que las radiaciones en longitudes de onda 
similares presentan a su vez comportamientos similares en muchos sentidos. En la 
figura 6.3 se muestra un esquema del espectro electromágnético y sus principales 
regiones de interés. 
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Figura 6.3: Espectro electromagnético y sus principales regiones de interés (Tomado 
de Wikipedia). 

Dentro de estas regiones, son de destacar las siguientes: 

■ Rayos 7 <0.03 nm. 

■ Rayos X (0.03 nm - 3 nm). 

■ Ultravioleta (3 nm - 0.3 p). 

■ Visible (0.3 /i - 0.7 p). Se corresponde con las radiaciones que pueden ser de- 
tectadas por el ojo humano o por aparatos tales como una cámara fotográfica 
común. Observando la figura 6.3 puede apreciarse que esta región represen- 
ta una porción muy pequeña del total del espectro. Existen muchas otras 
regiones que no podemos «ver» pero que, empleando la tecnología adecuada, 
sí que pueden aprovecharse para crear imágenes dentro de un proceso de 
teledetección, siendo de gran utilidad para el estudio de numerosos procesos. 
Las distintas longitudes de onda dentro de esta región son las responsables de 
los distintos colores que percibimos. Así, por ejemplo, el azul se corresponde 
con el rango entre 0.4 p y 0.5 p, mientras que el verde lo hace con el rango 
entre 0.5 p y 0.6 p 

■ Infrarrojo cercano (0.7 p - 1.3 p). 

■ Infrarrojo medio (1.3 p - 8 p). 

■ Infrarrojo lejano o térmico (8 p - 14 p). Dentro de esta región se encuen- 
tran principalmente las radiaciones emitidas por los cuerpos debido a su 
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temperatura 3 . 

■ Microondas (1 mm - 25 cm). 

En el capítulo 16 estudiaremos para qué tipo de análisis resulta útil cada una de 
las regiones del espectro, cuando veamos como analizar las imágenes procedentes 
de la teledetección. 

Como ya se dijo en el capítulo 5, las imágenes como capas ráster presentan 
habitualmente la particularidad de tener varias bandas. En lugar de un único 
valor para cada celda, existen n valores, uno por cada banda. Esto es así porque la 
imagen recoge la intensidad de la radiación (recordemos que esto se denominaba 
Nivel Digital) dentro de una amplitud dada del espectro, y a su vez subdivide 
esta en distintas franjas. Los Niveles Digitales de cada banda corresponden a la 
intensidad dentro de una de esas franjas del espectro en particular. 

Interacción entre radiación y materia 

La radiación emitida por una fuente de radiación es alterada por la presencia de 
los distintos objetos, que interactúan con ella. Independientemente de su proceden- 
cia, para toda radiación se dan tres fenómenos fundamentales al alcanzar un objeto: 

■ Absorción. El objeto toma la energía de la radiación. 

■ Transmisión. La radiación atraviesa el objeto y continua su camino. 

■ Reflexión, la radiación «rebota» en el objeto y vuelve al espacio. 

Estos tres fenómenos se dan en diferente proporción en función de las carac- 
terísticas del objeto y de la radiación. Para una longitud de onda dada, existe, 
pues, un porcentaje de la radiación que es absorbida por el objeto, otra que se 
transmite a través de él y otra que es reflejada. La parte que interesa a efectos 
de la teledetección es aquella que se refleja en el objeto, ya que esta es la que 
posteriormente puede recogerse y emplearse para la generación de las imágenes. 

La proporción en la que los tres procesos anteriores se dan en un objeto no es 
la misma para todas las radiaciones. Un objeto puede absorber una gran parte 
de la radiación dentro de una región del espectro y sin embargo reflejar la mayoría 
de ella en una región distinta. Es por ello que, en función del análisis que se desee 
realizar, debe trabajarse con imágenes que traten una u otra región. 

Igualmente, una imagen con varias bandas contiene información sobre la in- 
tensidad de la radiación reflejada en distintas partes del espectro. Puesto que cada 
objeto refleja de forma diferente la radiación en cada una de esas partes, pueden 
igualmente emplearse para identificar objetos particulares si se conoce la respuesta 
de estos en determinadas bandas. Por ejemplo, si sabemos que los objetos que bus- 
camos reflejan gran cantidad de radiación en todas las longitudes de onda excepto 
en un rango concreto. Aparece así el concepto de firma espectral como la respuesta 
característica de un tipo de objeto dentro del espectro electromagnético. Veremos 

3 Esta emisión se calcula según la denominada ley de Stefan-Boltzmann. Puede encontrarse 
más al respecto en [53] 
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mucho más al respecto en el capítulo 16, así como en el 20, donde estudiaremos 
una aplicación habitual de dichas firmas espectrales. 

Además de la interacción con los objetos que se pretenden estudiar, la radiación 
interactúa con la atmósfera. Esta interacción afecta al resultado y es una variable a 
considerar en ciertas operaciones posteriores con las imágenes. Veremos más sobre 
la interacción entre radiación y atmósfera en el apartado 16.2, cuando tratemos 
esas operaciones. 

6.4.2. Sensores y plataformas 

En un sistema de teledetección, dos son los elementos tecnológicos principales 
que lo definen: el sensor y la plataforma. 

El sensor es el elemento que incorpora la capacidad de «leer» la radiación elec- 
tromagnética y registrar su intensidad dentro de la una zona concreta del espectro. 
En palabras más sencillas, es el aparato que nos permite «tomar» la imagen, y 
puede ir desde una simple cámara fotográfica hasta un sensor más especializado 
capaz de tomar cientos de bandas en una región del espectro de gran amplitud. 

La plataforma, por su parte, es el medio en el que se sitúa el sensor y desde el 
cual se realiza la observación. Los dos tipos principales de plataformas son aquellas 
situadas dentro de la atmósfera terrestre (aviones en su mayoría, aunque también 
en otros medios tales como globos aerostáticos) y aquellas situadas fuera de la 
atmósfera (a bordo de satélites) 

Las características de estos dos elementos definen las del sistema en su con- 
junto, así como las propiedades de sus productos derivados y la utilidad que estos 
presentan. 


Plataformas 

La plataforma es el medio en el que se transporta el sensor, y condiciona las 
mediciones efectuadas por este, ya que establece la distancia a la que el sensor se 
sitúa del elemento registrado (la superficie terrestre) . Esta distancia puede ser del 
orden de algunos centenares de metros o unos pocos kilómetros, o bien de muchos 
kilómetros. En el primer caso, la plataforma más habitual es el avión, mientras 
que en el segundo caso lo más frecuente es el uso de satélites. 

Los aviones son las plataformas clásicas a bordo de las cuales se montaban 
originariamente las cámaras empleadas para la realización de fotografías aéreas. 
No obstante, hoy en día pueden montarse igualmente otros sensores más complejos 
y modernos a bordo de aeronaves. 

Las ventajas del empleo de aviones como plataformas de teledetección son las 
relacionadas con la disponibilidad de la plataforma, que es mucho mayor que en el 
caso de emplear satélites. Podemos (dentro de lo razonable) escoger cómo, cuándo 
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y dónde efectuar un vuelo y tomar imágenes, mientras que en caso de satélites la 
disponibilidad viene condicionada por numerosos factores y es muy reducida. 

Respecto a los inconvenientes, pueden citarse entre ellos la inestabilidad de la 
plataforma y la dependencia de las condiciones del clima, que pueden afectar a la 
propia estabilidad y a la calidad de los resultados, o incluso impedir la realización 
del vuelo. Por ser plataformas de baja altura, no pueden abarcar superficies tan 
amplias como los satélites, requiriendo más tiempo para cubrir una zona dada. 

Por su parte, los satélites artificiales presentan unas características distintas 
como plataformas de teledetección, siendo muy útiles para la teledetección sobre 
la superficie terrestre. Es habitual que a bordo de un mismo satélite coexistan 
diversos sensores, de forma que una única plataforma transporta varios de ellos. 

A diferencia de un avión, un satélite no puede dirigirse a voluntad (no puede 
pilotarse) , y su movimiento es una característica inherente que viene definida por 
una serie de parámetros. Estos parámetros se conocen como parámetros orbitales 
pues definen la órbita descrita por el satélite en torno a la Tierra. 

Por una lado, las órbitas pueden clasificarse en función de su eje de rotación 
en tres tipos: 

■ Ecuatoriales, si se sitúan en el mismo plano en el ecuador terrestre. 

■ Polares, si se sitúan en un plano que contiene al eje de rotación terrestre. 

■ Semipolares, si la órbita es oblicua al eje de rotación 

Con un criterio distinto, atendiendo a la forma en que se produce el movimiento, 
distinguimos dos tipos de órbitas para un satélite: 

■ Geosíncronas. El satélite se sitúa sobre un punto fijo de la Tierra y su mo- 
vimiento sigue al de rotación de esta. Es decir, no existe movimiento relativo 
entre dicho punto de la superficie terrestre y el satélite. Todas las imágenes 
que se toman desde el satélite tendrán así el mismo encuadre y cubrirán una 
extensión idéntica. La altura del satélite es fija, siendo esta de 35.786 Km, 
ya que esta altura hace que la velocidad del satélite se corresponda con la 
de rotación de la Tierra. 

La ventaja de este tipo de satélites es que, por situarse siempre sobre un 
punto y siempre teniendo visión sobre una zona dada, se pueden actualizar 
con mucha frecuencia las imágenes. El inconveniente principal radica en el 
hecho de que las zonas alejadas del punto sobre el que se sitúa el satélite 
tendrán mala cobertura, y existirán zonas no cubiertas de las que no resultará 
posible obtener imágenes con los sensores montados a bordo de dicho satélite. 
Pese a que un sensor sobre un satélite con órbita geosíncrona cubrirá una 
gran porción de la superficie terrestre (debido a la elevada altura a la que ha 
de situarse para tener dicha órbita), no resulta posible, como es lógico, cubrir 
toda ella y hacerlo además en las mismas condiciones en todas las zonas. 

■ Heliosíncronas. Las órbitas heliosíncronas son generalmente polares. Mien- 
tras el satélite recorre la órbita, la Tierra efectúa su movimiento de rotación, 
lo cual hace que a cada vuelta de la órbita se cubran zonas distintas. De esta 
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forma, se consigue dividir la totalidad de la superficie terrestre en bandas 
que se van recorriendo sucesivamente hasta que el satélite vuelve a situarse 
en el mismo punto inicial. Las órbitas están diseñadas de tal manera que 
ese regreso al punto inicial se produce a la misma hora solar exacta que en 
el anterior ciclo, de forma que las imágenes tomadas en un punto dado son 
registradas siempre a la misma hora y en condiciones similares de iluminación. 
Para que sea posible realizar una órbita de este tipo, el satélite debe situarse 
entre 300 y 1500 Km de altura. 

La figura 6.4 muestra un ejemplo de la forma en que un satélite con una 
órbita heliosíncrona barre toda la superficie de la Tierra. 



Figura 6.4: Esquema de barrido de un satélite con órbita heliosíncrona. Tomado de [54] 

Debido al movimiento que causa las distintas franjas, los satélites con este 
tipo de órbitas pueden cubrir toda la superficie terrestre, algo que no es 
posible con los de órbita geosíncrona. No obstante, una vez que se toma una 
imagen de una zona, la plataforma no regresa a ella hasta que se concluye 
todo el ciclo, habiendo transcurrido un periodo de tiempo que se conoce como 
periodo o intervalo de revisita. Debido a ello, la actualización de las imágenes 
no puede ser tan inmediata como en el caso de satélites geosíncronos. 

Sensores 

Montado a bordo de cualquiera de los tipos de plataformas que hemos vis- 
to en el apartado anterior, el sensor es el encargado de registrar la radiación 
electromágnética procedente de la zona estudiada y «tomar» la imagen. 

Existen diversas formas de clasificar los sensores. Una división básica es la 
que distingue sensores activos y sensores pasivos. Como ya sabemos, la radiación 
que recoge el sensor es el resultado de una fuente de radiación electromagnética, 
cuyas emisiones interactúan con el medio, que refleja una parte de las radiaciones 
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que le llegan. Los sensores pasivos aprovechan las fuentes de radiación existentes 
en la naturaleza (fundamentalmente el Sol) y se limitan a recoger la radiación 
de dichas fuentes reflejada por los elementos del medio, o la que estos elementos 
emiten por sí mismos. El sensor no produce ningún tipo de radiación de por sí. 
Por el contrario, los sensores activos sí emiten radiación, y recogen dicha radiación 
tras ser reflejada por los elementos del medio. 

La diferencia fundamental entre estos dos tipos de sensores es que los activos 
pueden funcionar en cualquier instante y no dependen de la condiciones atmosféri- 
cas o el momento del día. De la misma forma que no podemos tomar una fotografía 
de noche sin luz, y no podemos ver el suelo desde un avión cuando hay nubes, no 
podemos utilizar un sensor pasivo en esas condiciones para tomar una imagen. Sin 
embargo, sí podemos hacer una fotografía de noche si disponemos de un flash, ya 
que la propia cámara emite la luz que necesita. La filosofía de un sensor activo es 
en cierta medida similar al caso de la cámara con flash. 

Los sensores activos emiten su propia radiación, por lo que no es necesario que 
existan fuentes externas (no es necesaria la luz solar). Asimismo, los elementos 
atmosféricos tales como las nubes, que afectan a la radiación visible, no afectan a 
otros tipos de radiación, permitiéndoles una operatividad total en la gran mayoría 
de condiciones. Por ello, los sensores activos suelen trabajar en el rango de micro- 
ondas (frente a los sensores pasivos, que lo hacen en las regiones del visible y el 
infrarrojo principalmente), ya que estas son capaces de atravesar la atmósfera en 
prácticamente todas las condiciones, presentando así ventajas frente a los sensores 
pasivos en este aspecto. 

Aunque el producto habitual de la teledetección son las imágenes, entendidas 
estas como algo visual, algunos sensores no forman tales imágenes, y los valores que 
recogen no son las intensidades de la radiación reflejada por el terreno en una longi- 
tud de onda dada. Es decir, no se corresponderían con el concepto de Nivel Digital ya 
presentado. Este tipo de resultados son habituales en los sensores de tipo activo, en 
los que la radiación que el propio sensor emite es recogida tras reflejarse en el terreno, 
pero la variable que se mide de ella no es su intensidad sino, por ejemplo, el tiempo 
que tarda en regresar. Planteamientos como estos permiten la generación de capas 
de datos que no son imágenes como tales, como es el caso de las capas de elevación 
(Modelos Digitales de Elevaciones) , ya que el tiempo de retorno está directamente re- 
lacionado con la distancia recorrida por la radiación, y este con el relieve del terreno. 

Estos sensores, no obstante, operan de un modo similar a lo que ya conocemos, 
y se consideran igualmente dentro del ámbito de la teledetección, pues se adscriben 
a la definición de esta dada al principio de este apartado. Veremos igualmente 
ejemplos de algunos de ellos cuando veamos más adelante algunos sensores de 
particular relevancia, ya que tienen una gran importancia en la actualidad para 
la generación de cartografía variada, como por ejemplo la ya citada de elevaciones. 
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El radar 4 es la tecnología más importante dentro de este grupo. El sensor envía 
pulsos de radio, y posteriormente recoge estos midiendo su intensidad y pudiendo 
calcular también la distancia al objeto. 

Puesto que la región de microondas en la que trabaja el radar es amplia, esta 
se divide a su vez en bandas. Los sensores de radar pueden trabajar con diferentes 
bandas de entre estas, las cuales tienen asignada una nomenclatura estandarizada. 
Además de esto, también puede trabajarse con diferentes polarizaciones de la señal 
de radio, obteniéndose resultados distintos en cada caso, lo que hace posible una 
mayor riqueza de resultados. 

El radar es una técnica muy compleja cuyo estudio requiere el conocimiento 
de unos fundamentos teóricos propios que exceden el ámbito de este capítulo, y no 
profundizaremos más en ellos. Para el lector interesado, en la dirección Web [55] 
puede encontrarse información muy abundante sobre teledetección basada en radar. 

Una técnica más moderna pero similar al radar es el denominado LiDAR 5 , que 
emplea pulsos de láser. El LiDAR es en la actualidad la tecnología más avanzada 
para la creación de cartografía de elevaciones, y dentro de este campo ha supues- 
to una verdadera revolución, ya que obtiene resoluciones muy elevadas, tanto 
horizontales como verticales (resolución en los valores de elevación calculados). 

Los sistemas modernos de LiDAR son capaces de proporcionar además varios 
retornos, de modo que, si el sensor sobrevuela una zona arbolada, se tiene infor- 
mación sobre la distancia a la copa y la distancia al suelo, ya que parte del láser 
atraviesa la copa y alcanza el terreno. Este tipo de resultados supone un salto 
cualitativo con respecto a los obtenidos con otras tecnologías. Esto permite no 
solo estudiar el terreno, sino derivar otros parámetro tales como la altura de la 
vegetación [56] . Asimismo, debido a su precisión, permite recoger elementos del 
terreno que con otros sistemas no resulta posible registrar, tales como edificios. 
A modo de ejemplo, la figura 6.5 muestra un modelo del World Trade Center el 
27 de septiembre de 2001, creado a partir de datos LiDAR. 

En la terminología del LiDAR, la imagen correspondiente al primer retorno 
(el de los puntos más altos) se conoce como Modelo Digital de Superficie (MDS), 
mientras que el correspondiente a la altura del suelo se conoce como Modelo Digital 
de Elevaciones (MDE). Veremos mucho acerca de MDE en posteriores capítulos 
de este libro. 

En [57] puede encontrarse una buena descripción del proceso de creación de 
estas capas de elevación partir de datos LiDAR. 

Además de la división entre activos y pasivos, otra forma de clasificar los 
sensores es en función de la forma en la que registran la imagen. Algunos sensores 
poseen un único detector de radiación que no cubre todo el ancho de la franja del 
terreno que se pretende recoger. Por medio de espejos oscilantes, se envía a este 

4 Acrónimo de Radio Detection and Ranging, detección y medición a partir de ondas de radio 

5 Acrónimo de Light Detection and Ranging, detección y medición de distancias a partir de luz 
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Figura 6.5: Modelo del World Trade Center realizado a partir de datos LiDAR tomados 
el día 27 de septiembre de 2001 (Fuente: NOAA/U.S. Army JPSD) 


detector la radiación procedente de los distintos puntos a lo ancho de esa franja, de 
forma que se van recogiendo los distintos píxeles de la imagen uno a uno, recorriendo 
esta de un lado a otro (Figura 6.6a). Estos sensores se denominan de barrido. 

Los denominados sensores de empuje (Figura 6.6b) eliminan la necesidad 
de utilizar espejos móviles, ya que poseen un número mayor de detectores que 
permiten cubrir todo el ancho de la imagen. Por ello, esta se va registrando no 
píxel a píxel, sino línea a línea. 




Figura 6.6: Esquema de funcionamiento de un sensor de barrido (a) y uno de empuje (b) 


Resoluciones 

Uno de los parámetros principales que definen las propiedades de un sistema 
de teledetección son las resoluciones. Estas establecen el nivel de detalle de los 
productos que el sistema genera, determinando este en las distintas magnitudes en 
las que el sistema opera. Las resoluciones dependen del sensor y de la plataforma 
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como binomio operativo, y de las características propias de ambos. Distinguimos 
cuatro resoluciones, a saber: 

■ Resolución espacial. Indica la dimensión del objeto más pequeño que 
puede distinguirse en la imagen. En líneas generales es el equivalente al 
tamaño de píxel 6 es decir, a la dimensión real que un píxel de la imagen tiene 
sobre el terreno. 

La resolución espacial está en función de la capacidad resolutiva del sensor 
y las características de la plataforma tales como la altura a la que se sitúa. 
Asimismo, la resolución espacial esta relacionada con la superficie que cada 
imagen cubre sobre el terreno. El concepto de Campo Instantáneo de Visión 1 
indica el ángulo de visión que abarca el sensor, y se utiliza habitualmente 
es este sentido. El Campo Instantáneo de Visión en Tierra 8 expresa esta 
misma idea pero en unidades de longitud sobre el terreno, y es función del 
IFOV y la altura a la que se encuentre el sensor. 

En el diseño de la órbita de un satélite debe tenerse en cuenta el campo de 
visión del sensor para optimizar el ciclo de toma de imágenes, así como para 
evitar que las distintas franjas que este cubre queden sin solaparse y existan 
zonas de las que no se tomen imágenes. 

■ Resolución espectral. Todo sensor cubre una región particular del espec- 
tro y almacena esta mediante un número dado de bandas. La región del 
espectro abarcada y el número de bandas son los elementos que definen la 
resolución espectral. Esta será elevada si el número de bandas es alto, ya 
que cada banda cubrirá un rango de frecuencias de menor amplitud. De 
este modo, la información de dos frecuencias cercanas puede separarse, ya 
que estas serán recogidas en bandas distintas, mientras que si el número 
de bandas es menor pertenecerán a la misma banda y no podrá hacerse 
distinción alguna (la resolución será menor). 

En función del número de bandas, pueden clasificarse las imágenes y los senso- 
res que las generan. Una imagen en blanco y negro contiene una única banda. 
Las imágenes en color contienen tres bandas, correspondientes a las frecuen- 
cias del rojo, el verde y el azul. Existen igualmente sensores con algunas ban- 
das adicionales como la del infrarrojo, que en total generan un número de ban- 
das no superior a diez. Todas estas imágenes se conocen como multiespectrales. 
Las imágenes superespectrales tienen una mayor resolución espectral (bandas 
más estrechas), y cubren una zona del espectro más amplia, no limitándose 


(, Desde un punto de vista formal, no ha de ser necesariamente así, ya que la imagen puede 
tomarse originalmente con unas características y después, mediante operaciones matemáticas 
(veremos estas en el capítulo 14), modificar el tamaño de píxel. Aunque este tamaño sea menor 
al original, los objetos de menor dimensión que podrán discernirse en esa imagen no serán iguales 
a ese tamaño, sino mayores. 

' Instantaneous Field of View (IFOV) 

8 Ground Instantaneous Field of Vision (GIFOV) 
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al rango visible o el situado inmediatamente junto a este. Por ello, su número 
de bandas es mayor, generando imágenes con varias decenas de ellas. 

Por último, las imágenes hiperespectrales presentan más de cien bandas, lo 
cual permite una caracterización espectral sumamente precisa. 

■ Resolución radiométrica. Para cada una de las bandas que produce 
un sensor (asociada esta a una determinada región del espectro según su 
resolución espectral), el dato recogido, que constituye su Nivel Digital, indica 
la intensidad correspondiente a esa región. El nivel de detalle con el que puede 
medirse esa intensidad es el que define la resolución radiométrica del sensor. 
El número de Niveles Digitales distintos que pueden recogerse es la medida 
de la resolución espacial, y habitualmente es una potencia de dos (de la 
forma 2 n ). Tanto las imágenes en blanco y negro como las imágenes en color 
trabajan con 256 (2 8 ) niveles, ya que este es el valor más cercano al número 
de diferentes intensidades que el ojo humano puede diferenciar 9 . No obstante, 
los sensores de teledetección pueden tener una mayor resolución radiométrica 
(hasta 1024 o 2048 niveles), que si bien no se aprecia en la representación 
visual, sí que supone una diferencia en el tratamiento analítico de esos Niveles 
Digitales. En la figura 6.7 puede apreciarse la diferencia entre dos imágenes, 
cada una de las cuales tiene una resolución radiométrica distinta. 



Figura 6.7: Dos imágenes con distinta resolución radiométrica (de izquierda a derecha, 
8 y 256 niveles, respectivamente). 

■ Resolución temporal. Indica el tiempo que tarda el sensor en volver a 
tomar una imagen de una misma zona. Tiene sentido en el caso de sensores 
orbitales, que funcionan por ciclos, y tras concluir este ciclo, vuelven a 
comenzar la toma de imágenes en el mismo punto. En cada ciclo, el sensor 
cubre toda la superficie terrestre «barriendo» esta en franjas sucesivas. 

9 En el ámbito del tratamiento de imágenes esto se conoce como profundidad de color. Una 
mayor profundidad de color indica mayor número de colores posibles. Una pantalla normal de 
ordenador puede mostrar un total de 16.7 millones de colores distintos , que corresponden a las 
combinaciones entre los 256 posibles niveles de cada una de las tres bandas (256 3 = 16,777,216) 
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La resolución temporal depende de la altura a la que se encuentra la plata- 
forma que monta el sensor, así como la resolución espacial. Si el tamaño de 
las imágenes es reducido (GIFOV pequeño), las franjas son más estrechas 
y se requieren más para cubrir toda la superficie y volver a comenzar el ciclo, 
con lo que la resolución espacial será menor. 

Parece lógico pensar que lo ideal en toda circunstancia sería disponer de imá- 
genes procedentes de sistemas con altas resoluciones en cualquiera de las clases 
anteriores. De esta forma, tendríamos imágenes con gran detalle espacial, espectral 
y radiométrico, y actualizadas frecuentemente. No obstante, la tecnología actual no 
dispone de elementos que ofrezcan resoluciones elevadas en todas las magnitudes 
del proceso, y en la creación de los sensores se favorecen unas en detrimento de 
otras. Algunas resolución presentan además un cierto antagonismo, como hemos 
visto para las resoluciones espacial y temporal, con lo que no resulta viable que 
ambas sean elevadas simultáneamente. 

Así, existen sensores con, por ejemplo, gran resolución espacial, en los cuales la 
resolución espectral no es tan elevada. Por el contrario, los sensores con mayor reso- 
lución espectral no suelen ofrecer un nivel de detalle espacial tan elevado como los 
anteriores. En ocasiones, una misma plataforma puede montar a bordo varios senso- 
res, de tal forma que el conjunto de ellos ofrezca información detallada de forma glo- 
bal, pero un único sensor no proporciona resolución elevada en todas las variables. 

Otro tipo de circunstancias relativas al sensor afectan igualmente a las reso- 
luciones. Por ejemplo, aquellos sensores que trabajan con radiaciones de poca 
energía (en la región de las microondas) y son de tipo pasivo requieren una amplia 
extensión para recoger la suficiente energía como para poder ser detectada por 
dicho sensor. Por esta razón, su resolución espacial suele ser baja. 

A la hora de utilizar imágenes de teledetección, debe considerarse qué tipo de 
resolución resulta de mayor interés para el proyecto que se lleva a cabo, teniendo 
en cuenta la escala de trabajo o el objetivo final que se persigue con el análisis a 
realizar, entre otros factores. En base a esto, se escogerá uno u otro producto, que 
será el que ofrezca los valores de resolución más adecuados en conjunto. 

Si se pretende localizar elementos de pequeño tamaño, es imprescindible 
trabajar con altas resoluciones espaciales. Si lo que se desea es clasificar una serie de 
zonas en función de sus características, la resolución espectral debe ser alta, ya que, 
como veremos, se usa la información de todas las bandas para dar esa clasificación, 
y un número mayor de bandas dará como resultado una mayor precisión. 

De igual, modo, la detección de cambios de intensidad en una banda hace 
necesario que se trabaje con una buena resolución radiométrica, pero si lo que se 
desea es estudiar esos cambios a lo largo de un periodo corto de tiempo, trabajar 
con un sensor con gran resolución temporal se hace imprescindible. 

En cada caso, las circunstancias particulares del trabajo condicionan la elección 
de uno u otro sensor, puesto que, como se ha dicho, un único sensor no ofrece 
elevadas resoluciones en todas las variables. 
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La utilización simultánea de datos de varios sensores en un proyecto es una alter- 
nativa en ciertos casos. Como veremos, existen técnicas que permiten combinar imá- 
genes con alta resolución espacial e imágenes con alta resolución espectral, con obje- 
to de obtener nuevas imágenes que combinen lo mejor de ambas y ofrezcan un nivel 
de detalle conjunto mayor. Estas técnicas realizan el proceso conocido como fusión 
de imágenes, el cual trataremos en el apartado 16.3.3, más adelante en este libro. 

Además de lo anterior, un único sensor montado a bordo de un satélite puede 
operar en varios modos distintos. Es habitual que un sensor multibanda pueda 
registrar también imágenes de una sola banda, recogiendo en ella la intensidad de 
la radiación correspondiente a todo el espectro visible, de tal forma que genere una 
representación visual real. Estas se suelen representar habitualmente en escala de 
grises, resultando una imagen en blanco y negro. 

Las imágenes de este tipo se conocen como pancromáticas 10 , y suelen tener 
mayor resolución espacial, por lo que pueden emplearse para la fusión de imágenes 
señalada anteriormente. Así, un mismo sensor provee todos los datos necesarios 
para llevar a cabo ese proceso, tanto la imagen de gran resolución espacial (la 
pancromática) como la de gran resolución espectral (la imagen multibanda) . 

6.4.3. Principales sensores y productos 

El número de diferentes productos provenientes de la teledetección es muy 
elevado en la actualidad. Ahora que ya conocemos los fundamentos del proceso 
y las principales características de un sistema de teledetección, es interesante mos- 
trar un pequeño resumen de los principales productos disponibles. En ocasiones, 
desconocer la existencia de productos adecuados puede suponer la realización 
incorrecta o de modo ineficaz de un proyecto SIG, y dada la gran variedad existente, 
esto sucede con frecuencia. 

A continuación se relacionan algunos de los sistemas de teledetección principales 
y las características de sus productos. 

■ L ANDS AT [54] . Se trata de un programa completo de adquisición de datos 
mediante teledetección, que ha lanzado hasta la fecha un total de siete 
satélites entre 1972 y 1999. Por ello, el volumen de datos recogido es enorme, 
y lo convierte en una de las fuentes de datos más ricas de entre las existentes 
en la actualidad. 

El último satélite, LANDSAT 7, tiene una órbita heliosíncrona y una re- 
solución temporal de 16 días. A bordo de él se monta el sensor ETM+ * 11 , 
que permite la obtención de imágenes pancromáticas con resolución de 15 

10 E1 término pancromático deriva de la fotografía clásica, conociéndose así al tipo de película 
sensible a todas las longitudes de onda del visible. Por similitud de conceptos, se emplea el 
término también para hacer referencia a las imágenes digitales monobanda generadas por 
sensores según lo comentado anteriormente 

11 Enhanced Thematic Mapper Plus 
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metros, e imágenes multibanda con resolución de 60 metros. El sensor recoge 
un total de 8 bandas, y el tamaño de la imagen es de 170 x 183 km. 

Los sensores TM 12 y MSS 13 se montan a bordo del satélite LANDSAT 5, 
todavía en funcionamiento y con una resolución temporal de 16 días. El 
sensor TM ofrece imágenes multibanda de 7 bandas con resolución de 30 
metros, excepto en la banda del infrarrojo térmico, donde la resolución es 
de 120 metros. Las imágenes tienen un tamaño de 185 x 172 km. 

■ IKONOS [58]. Este satélite, lanzado en 1999, monta un sensor con reso- 
lución de 1 metro para imágenes pancromáticas y 4 metros para imágenes 
multibanda (4 bandas). Las imágenes cubren una área de 11 x 11 km y el 
satélite tiene una resolución temporal de entre 3 y 5 días. 

■ SPOT 14 [59]. Un conjunto de satélites lanzados inicialmente por la agencia 
espacial francesa, con especial énfasis en la recogida de información relativa a 
variables ambientales. De los cinco puestos en órbita, dos siguen actualmente 
en funcionamiento. El último de ellos, lanzado en 2002, monta el sensor 
HRG con capacidad de producir imágenes pancromáticas con resolución 
entre 2,5 y 5 metros, e imágenes multibanda con resolución de 10 metros. 
El periodo de revisita es de entre 1 y 4 días. Es de destacar que el sensor 
permite inclinaciones de hasta 27°respecto al nadir hacia ambos lados, por 
lo que puede cubrir una banda más ancha y tomar imágenes fuera del área 
determinada en cada instante por la órbita. 

■ QuickBird. [60]. Ofrece imágenes en pancromático y multibanda (azul, 
verde, rojo e infrarrojo cercano). Las primeras tiene una resolución de 60 cm 
y las multibanda de 2,4 metros, aunque combinando las dos ofrece imágenes 
en color con 60 cm de resolución. La órbita del satélite es heliosíncrona y 
la resolución temporal varía entre los 3 y 7 días. Cada imagen cubre una 
superficie de 16,5 x 16,5 km. 

■ Aqua y Terra. Dos satélites lanzados por la NASA dentro de un proyecto 
de ámbito internacional para la observación de la Tierra. Cada uno de ellos 
monta una serie de diversos sensores, que recogen información relativa al 
ciclo hidrológico (en el caso del Aqua) y la superficie terrestre (en el caso 
del Terra). Entre estos sensores cabe destacar el MODIS, a bordo de ambos, 
o el ASTER, a bordo del satélite Terra. ASTER 15 recoge información en 
14 bandas distintas, con una resolución entre 15 y 90 metros, mientras que 
MODIS 16 es un satélite de menor resolución espacial (250, 500 o 1000 metros 
según la banda ), 36 bandas y una resolución temporal de 1 a 2 días. 
Además de los datos directos de los sensores, se proporcionan de forma 


12 Thematic Mapper 

13 Multispectral Scanner 

14 Satellite Pour 1’ Observation de la Terre 

15 Advanced Spaceborne Thermal Emission and Reflection Radiometer 
lf> Moderate Resolution Imaging Spectroradiometer 
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gratuita numerosos productos derivados, lo que lo convierte en una fuente de 
datos de primer orden para un gran número de aplicaciones, especialmente 
las relacionadas con el estudio del medio, la vegetación, etc. En la dirección 
Web [61] pueden obtenerse tanto datos originales como productos derivados. 

■ NOAA-AVHRR 1 ' . Se encuentra principalmente enfocado al estudio de 
los océanos, aunque sus datos pueden aplicarse en muchos más estudios. El 
sensor tiene una resolución de 1,1 km, y proporciona imágenes de 5 bandas 
en las regiones del infrarrojo y el visible. La resolución temporal es de medio 
día, produciendo una imagen nocturna y otra diurna. 

■ RADARS AT. Desarrollado por la Agencia Espacial Canadiense, monta un 
radar de apertura sintética (SAR), y su principal propósito es el control de las 
variaciones ambientales y de los recursos naturales. Más información en [62], 

■ ERS—1 y ERS— 2. Desarrollados por la Agencia Espacial Europea. Al igual 
que el anterior, ambos están pensados para la observación medioambiental, 
y montan tanto sensores activos como pasivos. Más información en [63]. 

■ SRTM. La misión SRTM 18 es un proyecto internacional de gran envergadu- 
ra destinado a la creación de una cobertura de elevaciones a nivel mundial. 
Utilizando sensores basados en radar montados sobre una lanzadera espacial, 
se realizó un vuelo global de la superficie terrestre a lo largo de 11 días, 
recogiendo el relieve de todas las zonas situadas entre los 56 grados sur y 
los 60 grados norte de latitud. La resolución de los datos obtenidos es de un 
segundo de arco (aproximadamente 30 metros), aunque solo se encuentran 
disponibles para Estados Unidos, siendo de unos 90 metros en el resto de 
zonas. Los datos SRTM se pueden descargar gratuitamente en [64] . Más 
información sobre el proyecto puede encontrarse en [65] . 


6.5. Cartografía impresa. Digitalización 

La primera fuente de cartografía de la que se disponía en las etapas iniciales de 
los SIG era la cartografía impresa. No se trataba de elementos creados pensando 
en su utilización dentro de un SIG y, de hecho, su estructura no es, como veremos, 
la más adecuada para ser incorporados como datos de trabajo en un SIG. Se trata, 
por tanto, de una clara fuente secundaria de datos espaciales. Aun así, esta fuente 
era la fuente principal de información cartográfica disponible entonces, y su uso 
ha sido desde esos tiempos una constante dentro del ámbito SIG. 

A pesar de que hoy en día disponemos de otras fuentes cartográficas, la carto- 
grafía impresa sigue siendo básica para trabajar con un SIG, ya que existe mucha 
información que todavía solo se encuentra en este formato. De una u otra forma, es 


1 ' Advanced Very High Resolution Radiometer 
18 Shuttle Radar Topography Mission 
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probable que un proyecto SIG implique en algún punto de su desarrollo la necesidad 
de recurrir a cartografía impresa y tratar esta para su inclusión dentro de un SIG. 

Cuando hablamos de cartografía impresa, no hay que pensar únicamente en 
mapas o planos, sino también en imágenes tales como fotografías aéreas, las cua- 
les, dependiendo de su antigüedad, pueden encontrarse disponibles tan solo en 
formato impreso, como hemos visto. Mientras que resulta posible adquirir estas 
en formato digital cuando se trata de fotografías más actuales, la tomadas por 
métodos analógicos correspondientes a vuelos más antiguos solo pueden adquirirse 
por regla general como un producto impreso. 

Los procesos que permiten obtener un producto digital a partir de esas imágenes 
son costosos en tiempo y dinero, y es por ello que no todos los proveedores de 
estas ofrecen la posibilidad de adquisición de un producto digital. En esta sección 
veremos esos procesos, tanto si partimos de un mapa o plano como si partimos de 
una imagen o cualquier otro documento impreso que pueda contener información 
cartográfica, susceptible de ser convertida en una o varias capas según se requieren 
para el trabajo en un SIG. 

Ya conocemos los dos modelos de datos con los que trabajamos en un SIG: el 
modelo ráster y el modelo vectorial. Tanto mapas como fotografías aéreas pueden 
servir como fuente de información para crear o bien capas ráster o bien capas 
vectoriales, ya que la información que contienen puede de igual modo representarse 
según uno u otro modelo (debe recordarse que, como se mencionó en el capítulo 
5, puede convertirse una capa ráster en vectorial y viceversa mediante algoritmos 
que detallaremos más adelante en este libro) . 

Un mapa o plano sobre un soporte impreso, sin embargo, dista considerable- 
mente de ese concepto de capa con el que trabajamos en un SIG. Suele contener 
información sobre distintas variables, tales como carreteras, elevación, núcleos ur- 
banos, uso de suelo, y todas ellas en un único elemento cartográfico. Esas variables, 
que en un SIG manejaríamos como capas independientes, se presentan como un 
conjunto que, según el uso que queramos darle, va a ser mucho más conveniente 
disgregar en base a esas distintas variables. 

Si pensamos en una fotografía aérea, esta puede considerarse como una simple 
imagen dentro de un SIG, y como vimos en el capítulo 5, las imágenes se adaptan al 
modelo de representación ráster. Por otra parte, en esa imagen existirán elementos 
tales como carreteras, ríos o árboles, los cuales se representan mejor según el modelo 
vectorial. En función de qué información nos interese tener dentro de un SIG o 
el modelo de representación preferente que queramos manejar, las operaciones que 
debemos llevar a cabo serán unas u otras. 

Este conjunto de operaciones posibles se conocen como de digitalización , y en 
función de la forma en que se desarrollen podemos distinguir los siguientes tipos: 

■ Digitalización automática 

■ Digitalización manual 

En la digitalización automática, el sistema (informático o mecánico) se en- 
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carga de generar los elementos digitales que ya podremos incorporar a un SIG, 
ahorrando trabajo al operador al automatizar la tarea. Este tipo de digitalización 
es muy habitual para el caso de obtener un resultado ráster mediante el proceso 
de escaneo. También resulta posible automatizar la digitalización para el caso 
vectorial, aunque requiere cierta labor por parte del operario y no es un proceso 
tan sencillo, pudiendo obtenerse resultados desiguales. 

La digitalización manual requiere por parte del operario una definición explí- 
cita de los elementos a crear, y es por ello únicamente adecuada para obtener un 
resultado vectorial, trazándose las entidades (sean estas puntos, líneas o polígonos) 
manualmente mediante algún sistema que permita esa introducción de datos. 

La elección de uno u otro tipo de digitalización no depende solo del tipo de 
capa que se desee obtener. Tanto la digitalización manual como la automática, 
tienen cada una de ellas su propias ventajas. En el caso ráster la opción manual 
no es viable, pero al digitalizar un mapa para obtener una capa vectorial puede 
ser interesante optar por una o otra metodología en función de las circunstancias. 

La digitalización manual es mucho más costosa y su resultado es muy variable 
en cuanto a su precisión espacial, ya que depende en gran medida de la experiencia 
del operario y de las condiciones de este (cansancio, circunstancias personales, 
etc.). Por el contrario, e independientemente del operario, el reconocimiento de 
las entidades es altamente fiable (si se trata de un mapa, este ha sido diseñado 
para ser interpretado por una persona, por lo que esta reconocerá sus elementos 
sin dificultad y con total fiabilidad). 

Asimismo, un proceso automático, en caso de proceder de forma correcta, 
tendrá una exactitud absoluta y «clonará» con absoluta fidelidad los elementos del 
mapa impreso. Esto resulta una ventaja a la hora de obtener una gran precisión, 
pero impide que en el proceso de digitalización se puedan corregir errores existentes 
en el documento original. Un operario puede advertir esos errores y corregirlos 
a medida que digitaliza. Un sistema automático, por el contrario, no puede. 

6.5.1. Digitalización manual 

La digitalización manual es la forma más básica de crear información digital 
a partir de un documento cartográfico impreso. Un operario trabaja directamente 
sobre la fuente cartográfica y su trabajo se traduce en la creación de una nueva 
capa, gracias a la utilización de un equipo que es capaz de convertir su trabajo 
en la información necesaria para crear dicha capa. 

En el modelo de representación ráster, los elementos básicos son las celdas, que 
forman una malla regular que puede presentar un numero muy elevado de estas. 
Una definición manual de las características de cada una de esas celdas resulta 
inviable, por lo que la digitalización de un documento cartográfico impreso para 
la obtención de una capa ráster a partir de ella de forma manual no es factible. 

Por el contrario, se puede realizar con cierta sencillez la digitalización de una en- 
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tidad vectorial, trazando la forma de esta o, en caso de ser una entidad de tipo punto, 
sencillamente indicando su localización. Cuando el número de entidades es elevado, 
el proceso puede llevar tiempo y ser tedioso, pero en todo caso sigue resultando una 
forma sencilla y accesible de crear una capa vectorial a partir de otra fuente de datos. 

Para llevar a cabo ese trazado de la entidad, se necesita emplear algún equipo 
que recoja la información introducida por el operador. Existen dos alternativas 
principales: utilizar un equipo especializado diseñado específicamente para la 
digitalización, o bien digitalizar utilizando las funciones de edición de un GIS, 
realizando todo el proceso dentro de este y sin más herramientas que el propio 
ordenador y un dispositivo señalador como el ratón. 

Con equipo especializado ( heads-down ) 

La forma tradicional de proceder a la digitalización manual de entidades es utili- 
zando equipos y periféricos expresamente diseñados para llevar a cabo esta tarea. La 
tableta digitalizadora (Figura 6.8) es la herramienta fundamental para este trabajo. 

N 

Tableta digitalizadora 



Figura 6.8: Esquema de una tableta digitalizadora y los elementos del proceso de 
digitalización. 

Se trata de una superficie plana a modo de atril, sobre la cual se sitúa el docu- 
mento cartográfico a digitalizar, y sobre este se van trazando las distintas entidades 
con un cursor. Este cursor registra los movimientos del operario, convirtiendo las 
posiciones del cursos en coordenadas reales, que son las que van a constituir la 
entidad digitalizada. El trabajo del operario consiste en seguir con el cursor las 
formas de las distintas entidades, como si las estuviera calcando, de modo que 
indique al sistema las geometrías que se quieren definir. 

El proceso de digitalización implica los siguientes pasos [15]: 
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■ Registro. La etapa fundamental del proceso, que garantiza que las coorde- 
nadas de las entidades digitalizadas sean correctas. El mapa se ha de adherir 
a la tableta de modo firme, normalmente con cinta adhesiva u otro medio 
similar, y señalar en él unos puntos de control de coordenadas conocidas. Será 
en base a estos como se calcularan las restantes coordenadas de las entidades 
que el operario defina mediante el cursor. Habitualmente se utilizan como 
puntos de control las esquinas y algún punto central del mapa. Es importante 
que en el proceso de registro el mapa no presente dobleces o deterioros que 
puedan inducir errores en el cálculo de coordenadas posteriores. 

■ Digitalización. De entidades puntuales, lineales y poligonales. 

■ Asignación de atributos. A cada una de las entidades digitalizadas se le 
añaden sus correspondientes propiedades. Este paso no se realiza ya con la 
tableta digitalizadora. En el caso más general, estos atributos se introducen 
manualmente con el teclado o se toman, por ejemplo, de una base de datos. 
Un caso particular, no obstante, es el de la digitalización de curvas de nivel. 
Una vez que estas han sido digitalizadas, no es necesario asignar valores 
individualmente a cada una de las lineas, ya que entre ellas existe una relación 
que puede aprovecharse para simplificar el establecimiento de una cota 
correspondiente a cada una. Estableciendo la elevación de una y la dirección 
en que la elevación aumenta, pueden sistemáticamente asignarse elevaciones 
a las curvas que aparecen según se avanza en dicha dirección. Los SIG más 
populares presentan habitualmente herramientas que facilitan este proceso. 

Esta forma de digitalizar se conoce como «cabeza abajo» ( heads-down ), en 
referencia a la posición del operario a la hora de trabajar sobre la tableta. 

Se distinguen dos formas principales de registro de puntos: 

■ Manual. El usuario debe ir marcando uno por uno todos los puntos que 
desee incorporar a la entidad digitalizada. Por ejemplo, para el caso de 
una línea, debe ir deteniendo el ratón regularmente en aquellos puntos que 
considere de interés, y sobre ellos pulsando los botones del cursor para indicar 
al sistema que ha de registrar dichos puntos. 

■ Semiautomática. El operario simplemente desliza el cursor definiendo la 
forma de los entidades, y el propio sistema se encarga de almacenar puntos 
regularmente según un intervalo de tiempo definido. Esto permite un ahorro 
de tiempo considerable y una correcta densidad de puntos recogidos para 
cada entidad. 

Las tabletas digitalizadoras son elementos caros, motivo por el cual se tiende a 
favorecer en la actualidad la digitalización en pantalla, que presenta además otra 
serie de ventajas adicionales, como seguidamente veremos. 
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En pantalla ( heads-up ) 

La otra forma de digitalizar elementos es utilizando las capacidades de edición 
de un SIG. Estas capacidades son heredadas de las aplicaciones de diseño asistido 
por ordenador (CAD) , y permiten «dibujar» en la pantalla del ordenador entidades 
y formas tales como los puntos, líneas y rectas que constituyen los objetos en el 
modelo de representación vectorial. 

En este proceso se parte igualmente de un capa base, generalmente una ima- 
gen, y basándose en ella se van definiendo los objetos, «dibujándolos» sobre la 
pantalla, una vez más como si se calcara aquello que puede visualizarse en dicha 
imagen. El hecho de que un SIG nos permita tener varias capas simultáneamente 
y visualizarlas a voluntad, facilita el proceso de digitalización. También lo facilita 
el poder tener varias imágenes sobre el fondo (cada una de ellas como una capa 
individual) , de modo que podemos cubrir un área más amplia que la de una simple 
hoja de mapa o una única imagen. 

En este proceso, no partimos en realidad de un documento cartográfico analógi- 
co, pues ya ha sido necesario digitalizarlo de alguna forma para incorporarlo en un 
SIG. El proceso es una digitalización de las entidades como tales, pero la informa- 
ción ya ha de estar en formato digital, aunque no en el modelo de representación 
vectorial, sino en el modelo ráster. Por ello, puede utilizarse como capa de partida 
una imagen originalmente en formato digital o bien una imagen originalmente en 
formato impreso. En este ultimo caso, la imagen ha debido digitalizar se previamente 
mediante un proceso de escaneo, el cual se tratará en la siguiente sección. 

En la figura 6.9 puede verse un ejemplo de la digitalización de una imagen en 
pantalla. 



Figura 6.9: Digitalización en pantalla. En rojo, polígono ya digitalizado. Las lineas rojas 
indican un nuevo polígono, actualmente en edición 

En la figura, sobre una imagen aérea en color se digitalizan las distintas parcelas 
que pueden distinguirse en esta. Del mismo modo, pueden digitalizarse curvas 
de nivel en un mapa escaneado, u otras entidades tales como ríos, lagos o vías de 
comunicación sobre una fotografía aérea, entre muchas otras. La digitalización en 
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pantalla puede incluso utilizarse teniendo como base no una imagen, sino capas de 
cartografía vectorial o cualquier capa de datos que aporte algún tipo de información 
que pueda delinearse con las mismas herramientas de edición. 

La digitalización en pantalla se conoce también como digitalización «cabeza 
arriba» (heads-up ) , ya que el operador centra su atención en la pantalla, con una 
postura bien distinta a la que se tiene al trabajar con una tableta digitalizadora. 

Frente a dicho trabajo con tableta digitalizadora, la digitalización en pantalla 
tiene las siguientes ventajas: 

■ Menor coste. No se requiere equipo especializado de alto coste, ya que 
basta con un ordenador personal. 

■ Posibilidad de dividir el trabajo. Cuando se trabaja con un mapa so- 
bre una tableta digitalizadora, este mapa no puede ser utilizado por otro 
operario. Sin embargo, el uso de una capa digital dentro de un SIG como 
base para la digitalización, permite que varios operarios trabajen con ella 
simultáneamente y se repartan el trabajo. 

■ Posibilidad de corrección y edición precisa. Las mismas capacidades 
que se usan para trazar las distintas entidades puede emplearse para corregir 
o modificar estas una vez que estas ya han sido digitalizadas (Figura 6.10), 
resultando esto en un proceso de digitalización más flexible. 

■ Posibilidad de ampliación. Para cartografías de baja calidad, puede ser di- 
fícil obtener precisión si se trabaja directamente sobre el mapa, así como si los 
elementos a digitalizar son pequeños, requiriéndose del operador un esfuerzo 
visual adicional. Las capacidades que tiene todo SIG para ampliar una imagen 
( zoom ) permiten superar esta dificultad y trabajar a distintas escalas según la 
precisión del trabajo a realizar o las características de los objetos digitalizados. 

■ Mayor precisión. La capacidad de resolución del ojo humano es mucho 
menor que la resolución de las imágenes (véase más adelante el apartado 
6.5.5). Esto, unido a lo mencionado en el punto anterior, permite aprovechar 
mejor la información de la fuente original, y que los resultados obtenidos en 
la digitalización de esta sean más fieles a ella. 

■ Mayor comodidad para el operario. La postura del operario es más 
adecuada cuando se digitaliza sobre la pantalla, permitiendo unas mejores 
condiciones. Esto que se traduce en menor cansancio y ello indirectamente 
comporta resultados más precisos. 

Para conocer con más detalle las capacidades básicas de edición de un SIG, 
así como las restantes capacidades que contribuyen a su vez a facilitar la labor de 
edición, consúltese el capitulo 22. 

6.5.2. Digitalización automática 

La digitalización automática limita el trabajo del operario, ya que este no es 
responsable directo de definir las propiedades de los elementos que se digitalizan. 
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Figura 6.10: Corrección de entidades con las funciones de edición de un SIG. El polígono 
de la derecha se encuentra en edición, siendo modificado uno de sus vértices. 


Este tipo de digitalización es la habitual en el caso de generar una capa ráster, aun- 
que también pueden obtenerse capas vectoriales procesando de modo automático 
cartografía impresa. 

Este segundo caso, no obstante, requiere una cartografía en condiciones espe- 
ciales, no siendo adecuada para todo tipo de mapas. En caso de no presentarse 
esas condiciones, los resultados de la digitalización no son óptimos, y requieren 
posteriormente un gran trabajo de corrección y supervisión. 

Escaneo 

El escaneo es el proceso de digitalización que convierte una imagen impresa 
(analógica) en una imagen digital [48]. El resultado de este proceso es, por tanto, y 
desde el punto de vista de un SIG, una capa ráster. Pueden escanearse tanto mapas 
como fotografías aéreas, operando en ambos casos de un modo similar y con las mis- 
mas consideraciones, pues el objeto del proceso es el mismo: la conversión del docu- 
mento impreso en un documento digital que pueda utilizarse dentro de un SIG o cual- 
quier otro software tal como, por ejemplo, un software de tratamiento de imágenes. 

El dispositivo fundamental para realizar este proceso es el escáner. Este se 
compone de una cabeza sobre la que se monta un sensor, y un soporte sobre el 
que se desplaza o bien la cabeza o bien el documento a escanear, de tal modo 
que durante el proceso de escaneo esta recorre todo el documento, recogiendo la 
información de toda su extensión. 

Este proceso de barrido se realiza en una única ocasión, aunque dispositivos 
más antiguos pueden hacerlo en tres ocasiones a la hora de escanear documentos 
en color. Aunque lo habitual es la creación de una imagen en color, también pueden 
obtenerse imágenes en blanco y negro o en escala de grises. 

Aunque existen escáneres específicamente diseñados para el trabajo con docu- 
mentos cartográficos, estos son dispositivos muy especializados y de muy elevado 
coste. Los escáneres más genéricos, pensados para el trabajo con todo tipo de 
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imágenes y para todo tipo de usos, pueden no obstante emplearse de igual mo- 
do para escanear tanto mapas como imágenes aéreas con resultados aceptables, 
utilizándose con frecuencia. 

Existen tres tipos principales de escáneres: 

■ De sobremesa ( flat-bed , ) . Los habituales para el uso doméstico o el escaneo 
de imágenes de pequeño formato, aunque también existen de mayor tamaño. 
El documento a escanear se sitúa sobre una placa de cristal bajo la que se 
desplaza la cabeza con el sensor. Puede verse uno de estos escáneres en la 
figura 6.11. 

■ De tambor. El mapa se sitúa sobre un tambor que rota, mientras que la 
cabeza se mantiene fija. La figura 6.12 muestro uno de estos escáneres. 

■ Alimentados. El sensor se mantiene fijo y el documento se desplaza me- 
diante un mecanismo de arrastre, de forma similar a como avanza el papel 
en una impresora doméstica. Salvo que dispongan de mecanismos específicos 
para corregir esta circunstancia, suelen presentar importantes distorsiones 
geométricas causadas por un desplazamiento impreciso del papel. 



Figura 6.11: Escáner de sobremesa (tomado de Wikipedia) 

Los parámetros básicos que definen las características de un escáner son la 
resolución espacial y la resolución radiométrica. La primera de estas de mide 
habitualmente en puntos por pulgada 19 y nos indica el número de puntos (celdas) 
que el sensor es capaz de tomar por cada unidad de longitud sobre el papel. La 
resolución radiométrica, por su parte, indica la capacidad del sensor para distinguir 
entre dos colores distintos. 

A la hora de trabajar con documentos cartográficos de cara a su posterior utili- 
zación en un SIG, tanto la resolución espacial como la radiométrica de los escáneres 
habituales es en general más que suficiente, incluso en ocasiones en aquellos de uso 
doméstico. No obstante, es habitual que se presenten distorsiones geométricas que 
suponen un problema importante a la hora de mantener la precisión cartográfica, 

19 Dots per inch( dpi) 
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Figura 6.12: Escáner de tambor (fotografía: Stefan Kuehn) 


y ello exige la utilización de equipos de mayor calidad si se requiere un resultado 
de alta precisión. Estos equipos no han de ser necesariamente de aquellos pensados 
para el trabajo con cartografía, sino que pueden ser de uso genérico, siempre, eso 
sí, que sean de la calidad necesaria. 

La velocidad del escáner es otro parámetro importante, pues la preparación 
de una base de datos cartográfica a partir de cartografía analógica puede llevar 
un tiempo considerable si el volumen de datos es elevado, ya que el proceso de 
escaneo es laborioso y requiere de cierto tiempo. El rendimiento del escáner y la 
velocidad a la que puede digitalizar una imagen dada está en relación directa con 
la resolución espacial. Un escáner posee una resolución nominal (en dpi), que es la 
resolución máxima a la que puede trabajar (el detalle máximo que puede recoger). 
No obstante, puede ajustarse la resolución de trabajo en función de las necesidades, 
y una resolución mayor siempre lleva asociado un tiempo de proceso mayor, ya que el 
volumen de información generado es mayor, así como el detalle que ha de registrarse. 

Para cada documento existe una resolución óptima de escaneo en función de 
las características de este. Esta resolución debe elegirse teniendo en cuenta que 
el volumen de datos aumenta a medida que empleamos una mayor resolución, bus- 
cando un equilibrio adecuado entre ese volumen de datos resultante y la cantidad 
de información que recogemos. Asimismo, se ha considerar igualmente el tiempo 
necesario para escanear el documento, tal como se dijo anteriormente. 

El parámetro base es la relación entre el tamaño de píxel (la longitud real 
que representa el ancho de un píxel sobre el terreno) y el tamaño de este píxel 
en la imagen (lo que mide esa longitud en el mapa) . Las resoluciones habituales 
utilizadas para el escaneo de fotografías aéreas varían entre los 100 dpi («250 ¡im 
cada punto sobre el mapa) y 2500 dpi ((« 10 ¡im cada punto sobre el mapa) [66]. 
Por ejemplo para una resolución de 300 dpi, se tiene: 
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300dpi = = 118, 11 filas /cm demapa (6.5.1) 

2,54cmdemapa 

En un centímetro cuadrado se tienen 118, ll 2 « 13950 puntos. 

Si trabajamos, por ejemplo, con un mapa a una escala 1:50000, tenemos que 
la distancia real que representa el alto de cada fila es 


50000cm 
118,1 lillas 


= 4,24metros /fila 


(6.5.2) 


Es decir, cada píxel del mapa representa sobre el terreno un cuadrado de lado 
4,24 metros. 

Con cálculos similares podemos calcular para cada posible resolución el espacio 
real que representa, y elegir esta en función del detalle que necesitemos. Como 
regla general, debe tratar de trabajarse con una resolución que garantice que los 
objetos que resultan de interés de la imagen (por ejemplo, aquellos que van a 
digitalizarse después manualmente mediante una digitalización en pantalla con 
esa imagen) sean distinguibles con claridad. 

En el caso de imágenes aéreas, la resolución de estas medida en pares de lineas 
por milímetro puede ser superior y permitir escanear a mayor resolución, aunque 
ello no es estrictamente necesario, y debe una vez más buscarse el equilibrio entre 
las ventajas y los inconvenientes de trabajar con una resolución más elevada. 

En [66] puede encontrarse información más detallada sobre la elección de una 
resolución óptima en el escaneo de imágenes aéreas. 

Para el caso de mapas, no deben olvidarse los fundamentos cartográficos en 
base a los cuales se ha creado dicho mapa, que fueron detallados en el capítulo 3. 
Trabajando con una resolución más elevada no hace necesariamente que estemos 
incorporando más información, ya que esta puede no existir en el mapa original. 
Tendríamos un volumen de datos más elevado que el necesario para recoger toda 
la información del mapa. 

Una diferencia fundamental entre escanear una hoja de un mapa y una imagen 
aérea es la diferencia de tamaño. Los mapas suelen tener tamaños mucho mayores 
que los de un escáner común, lo cual obliga a utilizar equipos de gran formato o, 
en la mayoría de los casos, contratar servicios de escaneo especializados, ya que 
estos equipos tiene un coste muy elevado. 

Una solución distinta en el caso de mapas de gran tamaño es el escaneo de la hoja 
por partes y la posterior unión de las distintas partes. En este caso, es necesario ase- 
gurarse de que las partes son coherentes entre sí en lo que respecta a las condiciones 
bajo las que se realiza el escaneo, así como garantizar que las distintas partes se sola- 
pan para que no existan zonas sin datos en la imagen resultante. Además de esto, el 
solape facilita la localización de puntos comunes presentes entre partes contiguas, lo 
que ayuda en la composición de todas las partes para dar lugar al resultado global. 
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Otra diferencia entre trabajar con mapas e imágenes es la relativa al tipo de 
soporte. En el caso de mapas, el documento original se encuentra siempre impreso 
en papel. En el caso de fotografías aéreas puede presentarse tanto en papel como 
en diapositiva. Los escáneres están preparados para capturar la imagen tanto por 
reflexión (cuando se trabaja con un documento en papel) como por transmisión 
(cuando se trabaja con una diapositiva o cualquier otro soporte transparente), por 
lo que ambos tipos de fuentes pueden utilizarse indistintamente para generar una 
imagen digital, siendo esta diferencia menos relevante a efectos prácticos. 

Por último, un aspecto clave en el escaneo de cartografía es la asignación de 
coordenadas a la capa resultante. Cuando utilizamos una tableta digitalizadora, 
debemos definir los puntos de control , que son los que establecen la referencia 
geográfica en base a la cual se calculan las coordenadas de los elementos que 
digitalizamos con el cursor. En el caso de escanear un mapa o una fotografía aérea, 
esa información está presente en el mapa en forma de marcas fiduciales o una 
retícula con coordenadas impresas, pero no se digitaliza como tal. 

Si simplemente escaneamos el documento, se digitaliza la marca fiducial o la 
etiqueta que indica las coordenadas, pero tan solo como una imagen, y no como un 
dato aprovechable por el SIG para otras tareas. En esta imagen, un operador puede 
ver las coordenadas de un punto, pero si realizamos un proceso de digitalización 
vectorial en pantalla utilizando esa imagen, el SIG no tiene forma de calcular las 
coordenadas de los puntos que introducimos, pues carece de una referencia. 

Para que una imagen procedente del escaneo de un documento impreso tenga 
plena validez y utilidad dentro de un SIG, es necesario añadirle información sobre 
la localización en el espacio del área representada en dicho documento. Este proceso 
se denomina georreferenciación. 

La georreferenciación es un proceso tratado dentro de este libro en el apartado 
16 . 2 . 1 , puesto que no es puramente un proceso que forme parte de la adquisición 
de datos, sino un tratamiento a aplicar una vez que el proceso de digitalización ha 
sido realizado. No obstante, es necesario recalcar de nuevo la importancia vital de 
este proceso, ya que sin él no resulta posible aprovechar el resultado del escaneo 
dentro de un SIG. 


Vectorización automática 

La vectorización automática es un proceso completamente distinto al de es- 
caneo, y no es tan habitual en el ámbito de los SIG, principalmente debido a la 
mayor dificultad que entraña. Como resultado de este proceso, se obtiene una capa 
vectorial, pero, a diferencia de la vectorización manual, el operario no tiene que 
señalar los puntos de estas o trazar los contornos de las entidades. 

Existen distintos procesos de vectorización automática, entre los que distin- 
guiremos los siguientes: 
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■ Vectorización en base a una imagen digital, por reconocimiento de entidades 
en un software apropiado. 

■ Vectorización mediante dispositivos específicos que trabajan sobre un do- 
cumento analógico. 

En el primer caso, partimos de una imagen digital, que puede proceder o no de un 
proceso de escaneo. Sobre esta imagen se aplican algoritmos que identifican de modo 
automático las distintas entidades y crean los correspondientes objetos vectoriales. 

El mayor inconveniente de esta técnica es que requiere que la imagen tenga 
unas condiciones especiales, pues de otro modo es difícil que esos algoritmos de 
identificación den resultados correctos. En ocasiones pueden crear entidades donde 
estas no existen o bien ignorar algunas por no ser capaces de detectarlas, así como 
crear entidades de forma y tamaño incorrectos. El trabajo de digitalización por 
parte del operario desaparece, pero es necesario un trabajo posterior de compro- 
bación y corrección, que en función de las características de la imagen de partida 
puede ser importante. 

Esta forma de vectorización automática es, al igual que la georreferenciación, 
un proceso a llevar a cabo sobre la imagen. Por esta razón, no se trata en este 
capítulo sino en el capítulo 16 dedicado al tratamiento de imágenes. Igualmente, 
el capítulo 17, dedicado a la conversión entre capas ráster y vectoriales, incluye in- 
formación acerca de procesos de vectorización automática, con particular atención 
a la conversión de un mapa escaneado en una capa vectorial de curvas de nivel. 

La otra forma de digitalización es totalmente diferente y no se realiza en el 
ordenador, sino en un periférico externo a este, tal como una tableta digitalizadora 
o un escáner. El dispositivo en cuestión es más similar a un escáner que a una 
tableta digitalizadora, pero su comportamiento imita al de un operario trabajando 
sobre esta última. 

Para ello, dispone de sensores luminosos y de láser que buscan las líneas en 
la imagen y las recorren, almacenando las coordenadas por las que han pasado en 
el recorrido. De este modo, se genera un resultado vectorial en lugar de uno ráster. 
El barrido de la imagen no es sistemático como el de un escáner, sino que «sigue» 
las líneas que están presentes en la imagen, y que son las que van a digitalizarse. 

Al igual que con la digitalización automática, las condiciones de la imagen de 
partida son básicas para obtener resultados de calidad. En un mapa, por ejemplo, 
las líneas habitualmente se ven interrumpidas por etiquetas (por ejemplo, para 
indicar la altura de una curva de nivel), o bien se dibujan en trazo punteado, o 
bien puede aparecer alguna mancha sobre ellas. Este tipo de elementos dificultan 
o incluso imposibilitan el correcto funcionamiento del dispositivo, ya que este no 
puede seguir las líneas adecuadamente, obteniéndose resultados de poca calidad. 
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6.5.3. Digitalización o creación de capas a partir de coordenadas. 

Geocodificación 

Junto a las formas de digitalización que acabamos de ver, existe una forma aún 
más básica: la digitalización directa de valores y coordenadas, sin necesidad alguna 
de dispositivos especializados o elementos gráficos. En este tipo de digitalización 
no existe un mapa o documento cartográfico, sino simplemente una serie de datos 
espaciales expresados de forma alfanumérica que son susceptibles de convertirse 
en una capa y emplearse así dentro de un SIG. 

Este proceso se conoce como geocodificación [67] e implica la asignación de 
coordenadas a puntos de interés, los cuales pueden ser de naturaleza muy variada. 
Asimismo, la procedencia de estos datos también puede ser muy variada, y en 
general muchas formas de trabajo en campo dan lugar a datos que, aún no estando 
originalmente dispuestos sobre mapas, sí que pueden emplearse como base para 
la creación de capas. Algunos ejemplos son los siguientes: 

■ Muéstreos de campo tales como la medición de parcelas en un inventario fores- 
tal. Cada parcela tiene una coordenada correspondiente a su centro, y los árbo- 
les medidos se referencian con un rumbo y una dirección en base a ese centro. 

■ Calicatas para análisis de suelo 

■ Levantamientos topográficos con instrumentación tanto analógica como 
digital. Existe un conjunto de instrucciones y procedimientos denominado 
COGO ( COordinate GeOmetry ), que facilita el trabajo con datos en forma de 
distancias y ángulos, de forma que las mediciones efectuadas a lo largo de un 
recorrido empleando un equipo tal como una estación total, un teodolito o un 
nivel con una mira, todos ellos pueden posteriormente convertirse con sencillez 
a coordenadas mediante la incorporación al SIG de ese conjunto de valores. 

■ Coordenadas en las que han sucedido algún tipo de sucesos. Por ejemplo, la 
geocodificación de localizaciones en las que han tenido lugar sucesos crimina- 
les permite posteriormente el análisis de su distribución y el establecimiento 
de políticas de seguridad más acordes con el escenario real. 

■ Coordenadas de cierto tipo particular de elementos, tales como elementos 
arquitectónicos, árboles singulares, paradas de autobús. Estas permiten la 
localización rápida de estos y una fácil catalogación, además de, en cone- 
xión con otras capas, cálculos como, por ejemplo, la forma más rápida de 
desplazamiento hasta uno de ellos. 

■ Coordenadas correspondientes a otras formas de codificación espacial. Sis- 
temas de localización espacial tales como códigos postales o, por ejemplo, 
los sistemas de indexación espacial CGDG o c-squares [68], pueden todos 
ellos vincularse a coordenadas geográficas, de tal modo que a cada uno de 
los códigos de estos sistemas se le asigne una de tales coordenadas. 

■ En la actualidad, Internet está viendo aparecer tendencias relacionadas con 
la asignación de una localización geográfica a muchos de sus elementos. Así, 
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puede añadirse a una página Web información sobre el emplazamiento donde 
ha sido creada, o añadirla a una fotografía digital que forme parte de un 
álbum alojado en otra Web. Los datos con los que trabajamos en la Web 
(textos, imágenes, etc.) llevan asociados a su vez otros datos (metadatos) 
con información sobre su localización. El proceso de añadir estos metadatos 
se conoce como geotagging. 

Todos estos datos presentan en común que, recogidos de un modo u otro, 
conforman un conjunto de coordenadas puntuales que habitualmente sirven para 
el trabajo fuera de un SIG y no llegan a incorporarse a este, o que al menos no 
están dispuestos en la forma habitual de capa con la que trabajamos en un SIG. 

En el caso de encontrarse en formato analógico, estos datos pueden digitalizarse 
mediante la simple introducción manual de coordenadas a través del teclado o 
bien mediante algún sistema más específico como el escaneo del documento y el 
empleo de algún software de reconocimiento de caracteres (OCR) 20 . 

En el caso de encontrarse ya en formato digital, estos datos pueden presentarse 
como tablas en una hoja de cálculo, datos asociados a otro dato de cualquier tipo 
(como en el caso del geotagging ) o incluso simples archivo de texto. Muchos SIG 
incorporan métodos para leer estos archivos y después utilizar las coordenadas 
que contienen con el fin de crear una nueva capa, en general de puntos. 

Un caso particular de la creación de puntos con coordenadas es la asignación 
de direcciones dentro de núcleos urbanos, tales como direcciones postales o códigos 
postales. Estas direcciones son de especial importancia en el desarrollo de activida- 
des dentro del entorno urbano, ya que es más habitual referirse al emplazamiento de 
un determinado elemento (por ejemplo, un comercio), en términos de su dirección 
postal que en coordenadas espaciales tales como las que se manejan en un SIG. 

La geocodificación de estos elementos implica establecer una coordenada 
geográfica correspondiente a cada dirección postal. Al realizar este proceso, es 
frecuente la interpolación de las coordenadas en las que se sitúan los distintas direc- 
ciones de una misma calle, ahorrando así esfuerzos. Mediante esta forma de operar, 
conociendo los números de los portales en ciertos puntos (habitualmente en cruces 
o números de portal múltiplos de un valor dado) se pueden asignar coordenadas 
a los restantes portales si se asume que estos se distribuyen de forma homogénea 
a lo largo de un tramo de calle, aplicando sencillos métodos de interpolación. La 
figura 6.13 muestra un ejemplo de ello. 

Esta práctica, no obstante, no es del todo precisa, ya que asume que los edificios 
se encuentran equiespaciados, y por tanto son del mismo tamaño todos ellos, lo cual 
no sucede en la práctica. Además de ello, el proceso presenta otras consideraciones 
particulares, tales como el hecho de que no en todos los países se sigue un mismo 
sistema de asignación de direcciones postales, teniendo cada uno el suyo propio, 
que puede diferir en mayor o menor medida de lo que podría considerarse un 

20 Optical Character Recognition 
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Figura 6.13: Interpolación de direcciones. En azul, direcciones conocidas. En rojo, 
direcciones interpoladas. 


sistema estándar. El supuesto habitual en que las direcciones pares se sitúan a un 
lado de la calle y las impares al lado contrario no resulta siempre cierto. 

Otro aspecto a tener en cuenta es que el edificio señalado con una dirección dada 
se identifica con una coordenada puntual, pero realmente ocupa una superficie 
[69]. Si esta es grande, puede presentar incluso varios puntos de acceso al mismo (o 
incluso accesos por varias calles distintas), con lo que la información que se recoge 
al geocodificar dicho edificio puede ser imprecisa e insuficiente. 

Por todo ello, la interpolación de direcciones permite una aproximación válida 
para muchos usos, pero en aquellos casos en los que se requiera más precisión no 
pueden emplearse estas direcciones con total seguridad, ya que la exactitud de las 
coordenadas asociadas por el proceso de interpolación puede variar notablemente 
según sea la propia configuración de los distintos edificios. 

6.5.4. Fotogrametría 

Un caso particular de digitalización lo encontramos en la fotogrametría. En la 
definición clásica de [70] , esta se define como la técnica para estudiar y definir con 
precisión la forma, dimensiones y posición en el espacio de un objeto cualquiera, 
utilizando medidas realizadas sobre una o varias fotografías. Esta definición no 
limita el alcance de la fotogrametría al ámbito de lo geográfico, y se utilizan sus 
principios en campos tales como la arqueología o la documentación de obras y 
monumentos, empleando para ello fotografías no aéreas, sino terrestres. Es la deno- 
minada fot ogrametría terrestre. No obstante, la rama de interés para este libro es la 
de la fotogrametría aérea, cuya base de trabajo tradicional son las fotografías aéreas. 

Esta clase de fotogrametría viene, pues, ligada íntimamente a los inicios de 
la teledetección, cuando los sensores modernos que hemos estudiado antes en este 
mismo capítulo no se habían desarrollado, y los existentes (básicamente cámaras 
fotográficas especialmente adaptadas a la toma de fotografías de tipo cartográfico) 
se montaban a bordo de aviones. Es por esta razón que tradicionalmente existe una 
conexión indudable entre ambas materias, no existiendo una frontera clara entre 
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ambas, y se consideran en ocasiones como términos idénticos que hacen referencia 
la disciplina global de obtención de imágenes y tratamiento de estas. 

Históricamente, el término teledetección aparece con posterioridad, una vez 
que las técnicas de toma de imágenes avanzan y dan un gran salto cualitativo 
con la aparición de las imágenes satelitales y los sensores electro-ópticos que ya 
conocemos. Algunos autores engloban la fotogrametría dentro de la teledetección, 
mientras que otros se refieren con el termino teledetección a las tecnologías más 
actuales y las consideran disciplinas distintas aunque muy relacionadas. Junto 
con la fotogrametría aérea aparece la fotogrametría espacial, encargada de operar 
sobre imágenes de satélite bajo unos principios similares. 

Dentro de este libro entenderemos por teledetección todo el conjunto de téc- 
nicas y operaciones de obtención de imágenes (que ya conocemos), así como las 
de tratamiento y posterior extracción de resultados a partir de estas (que iremos 
viendo en otros capítulos), obteniéndose estos resultados sin necesidad de estable- 
cer contactos con los objetos a estudiar, como corresponde a la definición dada en 
el apartado correspondiente. Dentro de ese conjunto de operaciones que nos llevan 
desde las imágenes a los resultados, entendemos como parte de la fotogrametría 
aquellas que tienen relación con la acepción original del término, es decir, aquellas 
que derivan de la medición de elementos. 

La denominación, no obstante, no es tan relevante, y sí lo es sin embargo 
comprender la importancia de ambas, particularmente dentro de este capítulo 
como técnicas de producción cartográfica. 

En lo que respecta a la fotogrametría, el proceso de restitución es el que interesa 
principalmente para el contenido de este capítulo, pues ofrece como resultado nue- 
vas capas de datos tanto bidimensionales como, especialmente, tridimensionales. 
Así, pueden obtenerse tanto las capas vectoriales digitalizadas que veíamos por 
ejemplo en el apartado 6.5.1, como directamente Modelos Digitales de Elevaciones 
a partir de imágenes. 

En realidad, los procesos de digitalización que ya hemos visto son también 
parte de la fotogrametría digital, y es habitual encontrarlos en los textos al uso 
sobre esta. También lo son los procesos de rectificación que se han citado en su 
momento, y que analizaremos en detalle más adelante en el capítulo 16. Como 
puedes ver, todas las técnicas están sumamente relacionadas, y las divisiones que 
hacemos pueden ser unas u otras en función del enfoque que se dé para su estudio 

Todas estas operaciones se llevan a cabo con una estación fotogramétrica, que 
comprende las herramientas necesarias para llevar estas a cabo (algunas, como 
los escáneres, ya las conocemos). En función del tipo de herramientas y técnicas 
distinguimos los siguientes tipos de fotogrametría, que representan a su vez la 
evolución de la disciplina. 

■ Fotogrametría analógica. Basada en mediciones y procedimientos sobre 
imágenes analógicas 
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■ Fotogrametría analítica. Basada en formulaciones matemáticas y técnicas 
computacionales, permite obtener grandes precisiones. 

■ Fotogrametría digital. Basada en el trabajo con imágenes digitales dentro 
de un entorno computerizado. 

El interés principal desde el punto de vista de los SIG es en la fotogrametría 
digital, ya que existe una gran relación entre estos y las aplicaciones empleadas en 
dicho tipo de fotogrametría. Es en esta en la que pueden englobarse los procesos 
de digitalización que ya hemos visto, y no en las restantes formas más antiguas de 
fotogrametría. En la fotogrametría digital, la estación fotogramétrica se articula 
sobre un ordenador en el cual se llevan a cabo los distintos procesos, no existiendo 
operaciones externas al mismo. Así, las imágenes se manejan dentro del ordenador 
y se visualizan a través de él, y la generación de nueva cartografía también se 
produce de forma digital. 

Esto no es muy diferente de lo que veíamos en el caso de la digitalización 
en pantalla algunas paginas atrás, pero el trabajo fotogramétrico engloba otros 
procesos además de los que ya hemos visto. Uno de ellos es la generación directa de 
cartografía de elevaciones, para la cual se requiere que el equipo empleado disponga 
de algunos elementos adicionales. Es decir, la estación fotogramétrica digital es 
más compleja que un simple ordenador, un dispositivo de marcado (un ratón) y 
un SIG, que eran los requisitos básicos para digitalizar en pantalla una imagen. 

Una estación fotogramétrica digital ha de tener, por ejemplo, capacidad para 
generar visualizaciones con sensación de profundidad a partir de pares de imáge- 
nes, que son las que permiten la posterior digitalización de los elementos con sus 
elevaciones correspondientes. Los principios en los que se basan este tipo de visua- 
lizaciones son los mismos empleados en la fotogrametría no digital, fundamentados 
en la visión estereoscópica. 

La visión tridimensional en el ser humano se basa en el hecho de que la imagen 
que ve cada ojo es ligeramente distinta a la del otro, lo cual permite al cerebro 
extraer información volumétrica y generar una verdadera visión tridimensional. 
En el caso de la fotogrametría, si en lugar de utilizar una única imagen aérea o de 
satélite empleamos dos, cada una de ellas tomada desde un punto distinto, resulta 
posible recrear el efecto que ambas imágenes tendrían para la reconstrucción 
tridimensional de la escena, y «engañar» al cerebro del observador para que este 
pueda observar la escena con volumen y profundidad. 

Cuando se emplean imágenes de satélite, los pares se pueden obtener con 
aquellas plataformas y sensores que permiten variar el ángulo de visión, de modo 
que en la misma pasada del satélite se toman imágenes de una zona desde distintos 
puntos. El sensor toma una imagen cenital y posteriormente, una vez ha superado 
la zona en su recorrido, toma una segunda imagen mirando «hacia atrás», la cual, 
combinada con la primera, permite el levantamiento del terreno y la realización 
de los procesos fotogramétricos (Figura 6.14). 

El sensor HRS que montan los satélites SPOT, o el sensor ASTER, ambos son 
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Figura 6.14: Toma de pares de imágenes estereosópicas desde un satélite, mediante 
variación del ángulo de visión. 


capaces de tomar este tipo de imágenes. En la dirección Web [71] puede encontrarse 
información detallada sobre las cartografía de elevaciones generada a partir de 
pares de imágenes tomadas por el satélite SPOT, junto con algunas ilustraciones 
y animaciones explicativas al respecto. 

Las formas de conseguir que el observador perciba la profundidad de la escena 
a partir de las imágenes son variadas, y van desde el uso de sencillos instrumentos 
ópticos o la generación de anáglifos (imágenes que combinan la información del 
par estereoscópico y que se han de observar con gafas con filtros distintos para 
cada ojo), hasta otras técnicas más complejas y elaboradas. En la fotogrametría no 
digital, el empleo de restituidores analíticos ha sido la metodología habitual. En la 
fotogrametría digital, este puede sustituirse por un equipo con dos monitores, cada 
uno de los cuales muestra una de las imágenes del par, y se emplean gafas especiales 
que son las encargadas de generar en el observador la sensación de profundidad . 

Además de lo anterior, la estación fotogramétrica digital dispone de periféricos 
específicos tales como ratones 3D, o manivelas como las que presentan los resti- 
tuidores analíticos, facilitando así la adaptación de los operarios a este tipo de 
estación (Figura 6.15). 

Por último el software que implementan, y que es el encargado de representar 
las imágenes y acoger el proceso de digitalización, suele ser específico, y es frecuente 
que se distribuya como parte de toda una estación fotogramétrica compuesta por 
los elementos reseñados anteriormente. Algunos SIG incorporan progresivamente 
capacidades adaptadas de este tipo de programas, pero por el momento la labor 
fotogramétrica queda reservada para este tipo de aplicaciones específicas, siendo 
el SIG tan solo un beneficiario directo de sus productos. 

Para el lector interesado en saber más acerca de los distintos elementos de la 
fotogrametría, obras como [72] o [73] son recomendables, esta última disponible de 
forma libre. En la dirección Web [74] puede encontrarse otra excelente referencia 
libre en dos tomos sobre fotogrametría analítica y digital. 
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Figura 6.15: Estación fotogramétrica digital. 

6.5.5. Calidad de la digitalización 

Uno de los aspectos más importantes del proceso de digitalización es la calidad 
del resultado obtenido, que debe tratar de ser lo más cercano posible a la calidad 
original de la información que se digitaliza, es decir, del mapa o imagen original. 
Independientemente de la precisión del equipo utilizado o la habilidad y experiencia 
del operario, la digitalización no es por completo perfecta, conteniendo siempre 
ciertas deficiencias y errores. 

Además de los errores que puedan incorporarse en las distintas fases del proceso 
de digitalización (sea este del tipo que sea) , hay que considerar que las fuentes 
originales a digitalizar también pueden incluir los suyos propios. Así, el proceso de 
escaneado puede incorporar distorsiones geométricas, pero es posible que el mapa o 
fotografía aérea de partida también presente alguna distorsión como consecuencia 
de su deterioro, más patente cuanto más antigua sea esta. 

La información contenida en el documento cartográfico puede también contener 
elementos problemáticos de cara a obtener un producto de calidad, que pueden ir 
desde líneas borradas total o parcialmente a manchas en el propio mapa derivadas 
de su uso habitual [15]. 

Dentro de los errores que aparecen como consecuencia de la digitalización en 
sí, un tipo importante de ellos son las discrepancias y coincidencias imperfectas 
entre las distintas entidades, tal como las que se muestran en la figura 6.16 

Estas imprecisiones son causantes de numerosos problemas, tales como la apa- 
rición de polígonos espúreos en las operaciones de solape entre capas vectoriales, 
que veremos en el capítulo 18. 

Debido a esto, las capacidades de edición de los SIG incorporan funcionalidades 
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Figura 6.16: Errores derivados del proceso de digitalización. a) Versión correcta, con nodos 
coincidentes, b) y c) Versiones con errores que causan una falsa desconexión entre las líneas. 



Figura 6.17: Ajuste automático mediante tolerancia (snapping). El nodo azul representa 
el nodo en edición. La tolerancia de enlace queda marcada por el circulo punteado. Puesto 
que el nodo rojo de la línea preexistente se encuentra dentro de esa tolerancia, al añadir 
el nuevo nodo (azul), este automáticamente se situará en las coordenadas del nodo rojo, 
garantizándose así la coincidencia. 


que permiten evitar estos errores en el momento de la digitalización, ayudando al 
operario en su tarea y permitiéndole alcanzar una exactitud y precisión imposible 
de lograr sin estas funcionalidades. Entre ellas, es especialmente importante el 
establecimiento de tolerancias y ajuste automático en función de ellas (esto se 
conoce con el término ingles snapping ), que ayudan a garantizar la coincidencia 
entre los distintos vértices. 

De este modo, polígonos adyacentes o lineas que se cortan en un punto dado 
lo hacen con total exactitud. Dichos polígonos comparten exactamente el mismo 
lado con las mismas coordenadas exactas, o se cruzan en el mismo e idéntico 
punto, y no únicamente pasan por un punto cercano (pero distinto) definido con la 
precisión con la que el operador haya podido ajustar ambas entidades visualmente. 
La coincidencia no es solo visual, sino numérica. La figura 6.17 muestra un ejemplo 
de la utilización de snapping en un proceso de digitalización. 

Mediante estas funcionalidades, el operador simplemente selecciona un punto, 
y el sistema digitalizador lo desplaza para que coincida con el punto existente más 
cercano, siempre que se encuentre a menos distancia que la tolerancia establecida 
de antemano. 

El hecho de que exista una completa coincidencia es especialmente importante 
cuando la capa vectorial que se digitaliza contiene información topológica. La 
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topología exige que la coincidencia sea correcta y defina perfectamente la rela- 
ción entre las entidades. Para los ejemplos b) y c) de la figura 6.16, las líneas no 
están conectadas ya que no existe coincidencia en el nodo. Si los puntos están 
suficientemente cercanos, puede «parecer» que son coincidentes, pero el SIG no 
los detectará como tales y no se podrá llevar a cabo ningún análisis topológico con 
esas líneas (por ejemplo, suponiendo que representan vías de comunicación y se 
quiere hacer un análisis de redes con ellas). 

La digitalización de entidades en caso de querer recoger la topología de las 
mismas debe obedecer una serie de reglas, a saber [75]: 

■ Las líneas deben cruzarse en nodos, en caso de que exista relación (conexión) 
entre ellas. 

■ Las lineas que coinciden en un nodo común deben coincidir exactamente. Las 
funciones de snapping se han de utilizar por ello durante la digitalización. 

■ Los lados comunes de los polígonos deben digitalizarse una única vez. 

■ Las áreas deben ser cerradas (el primer punto ha de coincidir exactamente 
con el último) . Las funciones de snapping o el cierre automático de líneas 
(asignar sistemáticamente al último punto del contorno del polígono las 
coordenadas del primero) deben emplearse para ello. 

Todos aspectos relativos a la calidad de datos, entre los cuales se incluyen las 
aspectos relativos a los errores del proceso de digitalización, se tratan con mayor 
profundidad en el capítulo 7. 


6.6. GPS 

Uno de los hitos en la aparición de nuevas fuentes de datos geográficos es la apari- 
ción de los Sistemas Globales de Navegación por Satélite (GNSS) 21 , que permiten la 
obtención de coordenadas geográficas de un modo inmediato, con las consecuencias 
que esto tiene para su uso en actividades como la elaboración de cartografía. 

En esencia, un GNSS es un sistema que permite conocer en todo momento y en 
cualquier punto del globo la localización exacta de dicho punto con un margen de 
error del orden de unos pocos metros o menos. Para ello, se basan en el envío de seña- 
les entre un dispositivo situado en el punto concreto y una red de satélites, pudiendo 
establecerse la posición exacta mediante las características de dicha transmisión. 

El ejemplo más extendido de un GNSS es el Sistema de Posicionamiento Global 
(Global Positioning System, o GPS) 22 , originalmente puesto en funcionamiento por 
el Departamento de Defensa de los Estados Unidos. Actualmente, este es el único 
GNSS completamente operativo, aunque existen otros tales como el GLONASS 

21 Global Navigation Satellite System 

22 E1 nombre completo del sistema es NAVSTAR-GPS (NAVigation SysTem And Ranging 
- Global Position System) 
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ruso, el COMPASS chino o el Galileo europeo, cuyo funcionamiento completo está 
previsto a corto plazo. 


6.6.1. Fundamentos del sistema GPS 

El sistema GPS se divide en tres subsistemas o segmentos: 

■ Segmento espacial. Lo componen los satélites de la constelación GPS (un 
total de 27, siendo 24 de ellos operativos y 3 de reserva), con los cuales 
se comunican las unidades receptoras, y en función de los cuales puede 
triangularse la posición actual de estas. 

■ Segmento de control. Lo forman un conjunto de estaciones terrestres que 
controlan el funcionamiento de los satélites, pudiendo enviar señales a estos 
para modificar su comportamiento. 

■ Segmento de usuarios. Lo conforman los receptores GPS y todos los dispo- 
sitivos que hacen uso de la señal de los satélites para el cálculo de posiciones. 

Los satélites del segmento espacial emiten una señal compleja cuyo contenido 
puede dividirse esencialmente en dos bloques de información: 

■ Señales empleadas para el cálculo de distancias. Estas incluyen dos có- 
digos: P (Precise) y C/A (Coarse/Aquisition) . El segundo de ellos es el emplea- 
do habitualmente, ya que el primero se encuentra encriptado y está pensado 
para uso militar, mientras que el C/A esta disponible para todos los usuarios. 

■ Mensajes de navegación. Estos informan de la posición orbital del saté- 
lite (conocida como efeméride ) , y pueden asimismo contener información 
adicional referente al segmento espacial. 

Las señales para el cálculo de distancias (en la terminología GPS estas distan- 
cias se conocen como pseudodistancias ) se envían mediante una onda portadora 
conocida como Ll, correspondiente a una frecuencia de 1575,42 MHz . El código 
P se envía además en una segunda portadora denominada L2, con una frecuencia 
de 1227,60 MHz. 

El funcionamiento del sistema se basa en la triangulación de la posición me- 
diante las señales procedentes de un cierto número de los satélites. Esta posición 
se calcula no únicamente en sus coordenadas x e y, sino también en z, es decir en 
elevación. El sistema GPS emplea como sistema geodésico de referencia el WGS84 
[76] . La precisión en el cálculo de la elevación es menor que la correspondiente a 
las restantes coordenadas, aunque también es de utilidad y puede emplearse en 
aplicaciones que van desde levantamientos y replanteos a usos en tiempo real como 
el cálculo de elevación en vuelos [77] . 

La posición de los satélites es conocida en todo momento, y los propios satélites 
informan de ella a los receptores a través de los mensajes de navegación. En base 
a esas posiciones orbitales, el proceso de triangulación que se lleva a cabo en el 
sistema GPS no se basa en el trabajo con ángulos, sino con distancias. 
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El cálculo de la distancia puede realizarse utilizando la información de las 
señales (los códigos C/A o P), o bien empleando las propias portadoras. El primer 
método es más sencillo y rápido, ya que no es necesario que el receptor «escuche» 
la señal durante un periodo prolongado de tiempo, lo cual sí es necesario en el 
segundo, como a continuación veremos. 

En el caso de emplear la portadora, se mide el desfase entre esta y una señal 
generada por el receptor, lo cual permite calcular una parte de la distancia (la que 
es menor que la longitud de onda de la señal) . La distancia total es igual a esta 
parte calculada más un numero entero de veces la longitud de onda. El valor de este 
numero entero es, no obstante, desconocido. Su cálculo se conoce como resolución 
de la ambigüedad (AR), y requiere escuchar la señal del satélite durante un cierto 
tiempo para recopilar datos suficientes que permitan el cálculo del valor antedicho. 

Así, la resolución de la ambigüedad es la que hace necesario un tiempo de 
inicialización de la unidad, con objeto de conocer esa constante en el desfase. 
Si la unidad pierde contacto con el satélite, es necesario de nuevo proceder a la 
resolución de las ambigüedades, quedando el receptor inoperativo durante ese 
periodo de tiempo. Más detalles sobre la resolución de la ambigüedad en el sistema 
GPS puede encontrarse en [78]. 

Puesto que la velocidad a la que la señal se desplaza es muy elevada, se requieren 
relojes muy precisos para poder medir con precisión los tiempos tan cortos que 
tarda dicha señal en recorrer la distancia entre satélite y receptor. A bordo de 
los satélites se montan relojes atómicos de muy alta precisión, pero las unidades 
receptoras no disponen de relojes tan precisos. Es por este motivo que, como 
veremos, han de introducirse correcciones y cálculos adicionales con el fin de 
obtener mayores precisiones en la medida del tiempo. 

Si el receptor es capaz de establecer comunicación con tres satélites, dispone ya 
de información suficiente para conocer su posición (x,y) como intersección de las 
esferas centradas en cada uno de dichos satélites y con radio la distancia existente 
entre este y el receptor. Con cuatro satélites se puede ya obtener la posición ( x,y,z ) . 

Un número mayor de satélites (cuatro al menos) es necesario, no obstante, 
para eliminar las imprecisiones debidas a los distintos elementos implicados, y se 
emplean habitualmente modelos más complejos que utilizan los datos de múlti- 
ples satélites y efectúan correcciones en función de ellos. Las deficiencias de los 
relojes que emplean los receptores pueden corregirse mediante la utilización de 
nuevos satélites, que permiten calcular con exactitud el tiempo, variable de gran 
importancia en el proceso y sin la cual no se pueden obtener precisiones elevadas. 

Los receptores actuales están preparados para trabajar con un número máximo 
de satélites habitualmente igual a 12, por lo que en todas circunstancias el receptor 
trata de localizar siempre el mayor número posible de satélites con objeto de lograr 
una mayor precisión. 

El diseño de la red de satélites está pensado para garantizar que en cualquier 
punto de la superficie terrestre y en cualquier momento, un receptor puede localizar 
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Figura 6.18: Dilución de la precisión. La geometría de los satélites en el ejemplo a) da 
una mayor precisión en el cálculo de la posición del receptor que la del ejemplo b) . 


el número necesario de satélites para obtener con exactitud su precisión. La locali- 
zación en la que se disponen los satélites con los que se establece comunicación no es 
irrelevante, ya que condiciona la precisión del posicionamiento, afectando a lo que 
se conoce como dilución de la precisión (DOP 23 ). Si los ángulos de los satélites son 
grandes, la precisión que se obtiene es mayor que si estos son menores (Figura 6.18). 

Junto a esto, existen otras muchas fuentes de error en el sistema GPS, cada una 
de las cuales afecta a la precisión del mismo. Entre ellas, cabe destacar las siguientes: 

■ Errores en la posición de los satélites. 

■ Errores por el rebote de la señal en otros elementos tales como edificios, con 
anterioridad a alcanzar el receptor. 

■ Errores derivados del paso de la señal por la atmósfera. Al atravesar la 
ionosfera y la troposfera se genera un retraso por la alteración que dicho 
paso produce sobre la señal. 

■ Errores en la precisión de los relojes, ya mencionados. 

■ Disponibilidad selectiva. Debido a su concepción como una herramienta 
militar, el departamento de Defensa de los Estados Unidos, propietario del 
sistema, introducía errores aleatorios en las señales, de tal forma que esta 
quedaba degradada y los usuarios civiles no podían obtener una precisión 
muy elevada. La disponibilidad selectiva fue eliminada en el año 2000. 

23 


Dilution of Precisión 


164 


Sistemas de Información Geográfica 



Figura 6.19: Esquema de funcionamiento del GPS diferencial 


En conjunto, todos estos errores suman desviaciones apreciables, que sin em- 
bargo pueden corregirse con la aplicación de técnicas adicionales, por ejemplo 
incorporando información adicional procedente de otros receptores. Una de estas 
técnicas es el denominado GPS diferencial, pensado en origen para eliminar el 
error de la disponibilidad selectiva, aunque también eficaz para corregir una buena 
parte los restantes errores citados anteriormente. 

Para la aplicación del GPS diferencial se requiere no solo un receptor único 
(aquel del cual se quiere calcular su posición), sino también otro receptor fijo de 
referencia cuyas coordenadas se conocen con alta precisión. Este receptor fijo es, 
a su vez, un receptor de alta precisión y, además de calcular su propia posición, 
emite información que las unidades receptoras pueden aprovechar para corregir 
sus mediciones. El receptor móvil, lógicamente, tiene que soportar este tipo de 
correcciones, para poder hacer uso de la señal de la estación de referencia. 

Los datos que permiten llevar a cabo la corrección puede obtenerse en el recep- 
tor mediante radio, descargarse por Internet mediante una conexión inalámbrica, 
o bien utilizar una constelación de satélites adicional dedicada a elaborar y servir 
este tipo de datos. 

La corrección puede realizarse fuera del propio receptor, a posteriori, utilizando 
software adecuado y los mismos datos de corrección que si se realiza la corrección 
en tiempo real. 

El fundamento de este sistema es que los errores que afectan al receptor móvil 
también afectan al de referencia. No obstante, la magnitud del error que afecta 
al receptor de referencia puede conocerse, ya que se conoce la coordenada exacta 
de este, y en base a eso puede eliminarse el error que afecta al receptor móvil, 
asumiendo que ambos errores son de similar índole. 

En la actualidad, aplicando estas técnicas de corrección diferencial, un GPS 
puede obtener precisiones del orden de 2 metros en latitud y longitud, y 3 en 
altitud[79]. Sin corrección diferencial, esta precisión es de unos 10-20 metros. 

La figura 6.19 muestra un esquema del funcionamiento del GPS diferencial. 


Fuentes principales de datos espaciales 


165 


Además de la literatura abundante sobre GPS, los fabricantes de receptores 
GPS, muy populares hoy en día para numerosas actividades, ponen a disposición 
del público una gran cantidad de información sobre sus productos y también 
sobre los fundamentos del sistema GPS. En ese sentido, una buena referencia es el 
sitio Web [80] , donde puede encontrarse una descripción detallada de los distintos 
elementos del sistema GPS, acompañada de imágenes y animaciones sumamente 
didácticas. En [81] también puede encontrarse información de interés y fácil acceso. 

6.6.2. Tipos de receptores 

La precisión del sistema global GPS depende del tipo de receptor GPS (o, en el 
lenguaje común, GPS a secas) que se emplee, obteniéndose mayores precisiones con 
receptores más avanzados, siempre dentro de las posibilidades del propio sistema 
GPS. 

En función de sus características y de la forma en que operan, podemos 
distinguir los siguientes tipos de receptores GPS: 

■ Receptores secuenciales. Establece conexiones secuenciales con los dis- 
tintos satélites disponibles, estando conectado a uno o dos a lo sumo simul- 
táneamente. Estos receptores son más económicos, ya que esta forma de 
operar requiere equipos menos complejos, aunque la precisión que se obtiene 
también es menor. 

■ Receptores continuos. Disponen de más canales de radio que los anterio- 
res y ello permite que la conexión a los satélites sea continua, sin tener que 
alternar entre uno y otro. La precisión que se obtiene es mayor, pero se trata 
de equipos más caros. 

■ Receptores con canales multiplexados. El esquema de funcionamiento 
es similar al secuencial, alternando entre los distintos satélites y utilizando 
un único canal. No obstante, utilizan software más complejo y procesadores 
más potentes, de forma que esta alternancia se puede producir con una 
frecuencia mucho más elevada. 

A día de hoy, es habitual que incluso los GPS de menor coste tengan múltiples 
canales, permitiendo la conexión continua con un número elevado de satélites. 

Como hemos visto, las señales emitidas por los satélites contienen dos códigos 
(C/A y P) que se transmiten modulados sobre dos ondas portadoras distintas (L1 
y L2). No todos los receptores GPS son capaces de utilizar estos elementos de las 
señales, y en función de ello podemos también clasificarlos. 

Los más sencillos únicamente basan sus cálculos en el código C/A, mientras 
que los más avanzados y complejos son capaces de utilizar el código P (encriptado, 
por lo que es necesaria una clave correspondiente) , así como las portadoras para 
un cálculo más preciso, según se explicó en un punto anterior. 

Por último, y teniendo en cuenta que el sistema GPS mide las coordenadas 
(x,y,z) y el tiempo, y que existen diferentes precisiones en función de la tecnología 
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que los receptores utilicen, encontramos una gran variedad de unidades receptoras, 
según estas se adapten para uno u otro uso principal. En líneas muy generales, los 
siguientes son algunos de los tipos principales en función de dicho uso. 

■ GPS para uso general. Unidades pequeñas y portátiles, de bajo coste, para 
actividades al aire libre, donde no se requiere una precisión elevada sino 
simplemente un conocimiento de la posición aproximada. Se emplean, por 
ejemplo, para recoger rutas en senderismo o navegación. Estas unidades, 
además de informar de la posición y ser capaces de almacenar esta, suelen dis- 
poner de capacidades de representación de mapas en pantalla, de forma que la 
información sobre la posición sea más útil para el usuario. Otros, como los na- 
vegadores GPS para coche, son capaces de calcular rutas óptimas, combinan- 
do la posición calculada con una cartografía de vías previamente incorporada 
al dispositivo. La figura 6.20a muestra un receptor GPS de uso general. 

■ GPS para la medición topográfica. Unidades de medio tamaño, generalmente 
con una antena independiente que se conecta a la unidad y que el propio 
operario carga a la espalda. La antena garantiza mayor precisión y una mejor 
localización de satélites en condiciones tales como zonas bajo arbolado. Están 
pensados para un uso profesional en levantamientos o replanteos, ofreciendo 
buena precisión en todas las coordenadas. En la figura 6.20b puede verse unos 
de estos receptores. Estos son los GPS de mayor interés para el uso dentro de 
un SIG, ya que ofrecen datos de campo precisos que cumplen con las necesi- 
dades que habitualmente se tienen en un proyecto SIG. Los datos recogidos 
por estas unidades pueden ser sencillamente incorporados a un ordenador, 
y en ocasiones la propia unidad dispone de aplicaciones propias, más allá 
de la mera visualización de cartografía asociada, como en el caso anterior. 

■ GPS para la medición del tiempo. Estos GPS no resultan de tanto interés 
para su uso en un SIG, ya que se encuentran fijos en un punto y no conceden 
importancia a la localización espacial, sino tan solo al tiempo. Se utilizan 
en estudios que requieran una medición muy precisa del tiempo, ya que la 
referencia temporal que ofrece el sistema GPS es muy precisa y estable. 

6.6.3. Operaciones con la unidad GPS 

La forma en que utilizamos el receptor GPS para recoger los datos que emplea- 
remos posteriormente en el SIG puede ser muy variada en función del tipo de dato, 
la precisión necesaria o las características del propio receptor. 

Los receptores de menor coste están generalmente pensados para ser de utilidad 
directamente en el campo, por ejemplo para localizar un punto concreto y conocer 
la dirección en la que hay que moverse para llegar hasta él, pero tienen también 
capacidad para recoger coordenadas. Estas capacidades son las que resultan de 
interés desde el punto de vista de un SIG, ya que las coordenadas recogidas serán 
después los datos que llevemos a este. 
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Figura 6.20: Receptor GPS de bajo coste 
precisión con antena externa (b) 



uso general (a) y receptor GPS de alta 


Por su parte, las unidades de mayor precisión están concebidas para tareas 
tales como levantamientos topográficos, donde la toma de datos es lo fundamental, 
pero también para otras tales como replanteos, donde se requiere situar un punto 
de coordenadas conocidas. Al igual que en el anterior, las actividades que pueden 
llevarse a cabo con estos GPS y que interesan desde el punto de vista del SIG 
son aquellas que van a recoger coordenadas, pues son las que generan datos y 
convierten al GPS en una fuente de ellos. 

Las capacidades de recogida de datos en una unidad GPS de bajo coste per- 
miten almacenar puntos o trazados completos, encontrándose el operario inmóvil 
o bien en movimiento a lo largo de dicho trazado. Es habitual utilizar los vocablos 
ingleses de la terminología GPS para denotar los distintos elementos que pueden 
recogerse, conociéndose a un punto de interés aislado como waypoint y un trazado 
como track. Una serie ordenada de waypoints se conoce como route (ruta). 

En el trabajo con el receptor GPS, el operario se puede detener en un punto 
cualquiera y memorizar las coordenadas del mismo, añadiendo así un waypoint 
a la lista de los ya almacenados. Para crear un trazado, se suele disponer de funcio- 
nalidades de recogida automática de puntos, de tal modo que el receptor memoriza 
estos a intervalos fijos de tiempo. El operario simplemente ha de desplazarse por 
el trazado y dejar que el receptor haga su trabajo mientras tanto. Dependiendo 
del tipo de dato que quiera obtenerse, la edición posterior en gabinete habrá de 
ser más o menos intensa. 

Esta edición no está relacionada solo con la introducción de correcciones, sino 
con la interpretación de los distintos puntos recogidos. Por ejemplo, para registrar 
el trazado de una calle, el operario puede recorrerla, pero es probable que no lo 
haga de forma perfectamente rectilínea. El trabajo posterior con el conjunto de 
puntos debe resultar en la obtención de una línea recta a partir de estos, y ello 
requiere la interpretación de los datos disponibles. 
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Pese a que la precisión de estas unidades es limitada y no permiten técnicas avan- 
zadas de corrección (tal precisión no es necesarias para las actividades tales como 
senderismo o navegación para las que han sido diseñados estos receptores), los GPS 
de uso cotidiano pueden ser una fuente de datos de primer orden para la recogida de 
datos. Un ejemplo significativo de ello es el proyecto OpenStreetMap[82] , un proyec- 
to colaborativo para crear mapas libres cuya principal fuente de datos son unidades 
GPS sencillas. Este proyecto es uno de los muchos que existen actualmente de este 
tipo, los cuales se engloban dentro de la idea de Información Geográfica Voluntaria 
o Participativa , sobre la que hablaremos algo más adelante en el apartado 6.7. 

Para trabajos de mayor precisión tales como levantamientos topográficos, estos 
receptores no son, sin embargo, suficientes. El uso de receptores más precisos y 
de técnicas avanzadas es necesario para obtener precisiones mayores, que pueden 
ser incluso milimétricas. 

Estos receptores pueden emplearse individualmente del mismo modo que se 
hace con un GPS de bajo coste, y registrar puntos de forma similar. La verdadera 
potencia, no obstante, se obtiene cuando se realizan mediciones con la ayuda de 
una o varias unidades adicionales, las cuales aportan valores de referencia que 
permiten aumentar la precisión. 

Entre el receptor móvil y el de referencia se establece una línea base, y en el 
cálculo de la posición lo que se calcula es el vector ( x,y,z ) que une a ambas. Se 
trata pues, de una medición relativa, ya que expresa la posición del receptor móvil 
a partir de la del receptor de referencia. Puesto que la posición de este último se 
conoce con gran precisión y ese vector también se calcula con precisión, la posición 
buscada que se obtiene es altamente precisa. 

La principal ventaja con respecto a métodos topográficos clásicos es que no 
es necesario que haya visibilidad entre los dos receptores. De esta forma, puede 
utilizarse una estación de referencia aunque no sea visible desde un punto cuyas 
coordenadas queremos medir, y las líneas base pueden ser de mayor longitud. 

Otras ventajas también destacables son el hecho de que puede obtenerse una 
productividad mucho mayor, ya que una única unidad de referencia puede ser 
utilizada por varias unidades móviles. 

El número de técnicas existentes en la actualidad para realizar este tipo de medi- 
ciones (ya sea con uno o con varios receptores) es variada. El hecho de que se busquen 
mediciones precisas hace que se realicen mediciones utilizando la fase de la portado- 
ra, que como vimos implica una mayor necesidad de tiempo para registrar correcta- 
mente una posición. En función de las características de la linea base y los requeri- 
mientos concretos del trabajo, serán unas u otras las más adecuadas para cada caso. 

La diferencia principal entre estas técnicas es el tiempo necesario para la 
recogida de un punto. En general, un mayor tiempo equivale a una mayor precisión. 
Entre las técnicas habituales, cabe citar las siguientes: 

■ Estático. En base a dos puntos de referencia (con una unidad GPS fija en 
cada uno de ellos), se calcula la posición de un tercero en un punto dado. 
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Se trata del método más preciso, pero requiere tiempos de observación muy 
largos (superiores a una hora) , lo que lo hace inadecuado para levantamientos 
o replanteos. Este tipo de procedimientos se emplean casi exclusivamente 
en trabajos geodésicos y las lineas base pueden ser de gran longitud. 

■ Estático rápido. Igual que el anterior, pero con tiempos menores, del orden 
de 5-10 minutos por punto medido. 

■ Cinemático. En el método cinemático los tiempos son aún menores que en el 
estático rápido, del orden del minuto. El fundamento de la técnica es distinto a 
los anteriores, ya que tras la inicialización el receptor móvil puede desplazarse 
con más velocidad y no es necesario que se detenga durante un periodo largo 
de tiempo en cada punto, pero ello exige que durante el desplazamiento tanto 
la unidad móvil como la fija de referencia mantengan la recepción de las 
señales, que han de ser de al menos cuatro satélites (preferiblemente cinco), 
y los mismos para ambas unidades. Si alguna de ellas pierde la conexión, se 
hace necesario repetir de nuevo el proceso de inicialización [83] . 

Existe una gran variedad de procedimientos de tipo cinemático, cuya filosofía 
es esencialmente la misma, pero bajo nombres distintos. Aunque pueden 
existir diferencias en los fundamentos teóricos, la forma de proceder es en 
muchos casos muy similar. Técnicas como Stop & Go o pseudocinemático 
pueden incluirse en este tipo de métodos. En general, estos y otros se en- 
globan bajo la denominación de procedimientos cinemáticos, aunque sus 
características sean distintas en cada caso. 

Muchos de estos procedimientos vienen definidos por el equipo a utilizar, y 
los tiempos de paradas en cada punto medido, así como otros aspectos, son 
recomendados por el propio fabricante. La forma más correcta de llevar a 
cabo una toma de datos en campo, en este caso, es seguir las indicaciones 
concretas del fabricante de para cada producto. 

Un caso particular dentro de los métodos cinemáticos es el cinemático en 
tiempo real (RTK) , en el que, a diferencia de los anteriores, las correcciones 
necesarias se efectúan en tiempo real y no requieren postproceso. Se trata 
de la técnica más actual, y proporciona al operario mediciones exactas de 
su posición de forma instantánea, con las ventajas que ello conlleva. Las 
mediciones son más precisas, ya que el operario que las toma conoce el valor 
recogido en el mismo momento de hacer la medición, y puede de esa forma 
realizar una comprobación en el acto. Información más detallada sobre esta 
técnica puede encontrarse en [84] . 

Para profundizar más al respecto, en [85] puede encontrarse información sobre 
la realización de levantamientos con GPS, así como en [86]. 

En base a los ejemplos anteriores, y para concluir esta parte, podemos dar una 
clasificación de las operaciones con un receptor GPS en función de tres criterios 
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básicos: el número de unidades que se emplean simultáneamente, el movimiento 
(o ausencia de él) del receptor y el momento en el que se obtiene el dato ya listo 
para su utilización posterior. 

Según el número de unidades, tenemos: 

■ Absolutas. Se tiene un único receptor y un único operario. La posición se 
calcula con la información de los satélites, sin apoyo de otra unidad adicional. 

■ Relativas. Se emplea una unidad adicional a modo de referencia. Las medi- 
das se basan en la información de los satélites y la que aporta dicha unidad de 
referencia, y la posición se calcula en relación a esta en lugar de en términos 
absolutos. Estas operaciones alcanzan un grado de precisión mayor que las 
de tipo absoluto. 

Atendiendo al movimiento del receptor encontramos: 

■ Estáticas. 

■ Cinemáticas. 

■ Variantes intermedias. 

Por último, en función de la obtención de datos, distinguimos: 

■ En tiempo real. Las correcciones pertinentes se realizan en el acto, y el 
resultado que se visualiza en el receptor o se almacena en este ya ha sido 
filtrado y corregido. 

■ Con necesidad de postproceso. Las correcciones se realizan en gabinete 
posteriormente, con información que el receptor no posee o no es capaz de 
procesar de modo inmediato durante su utilización. 

6.6.4. Integración de GPS y SIG 

La utilidad de un GPS como fuente de datos para el trabajo en un SIG es 
innegable. Multitud de trabajos que requieren la toma de datos en campo y la 
medición de coordenadas pueden efectuarse ventajosamente con equipos GPS, y la 
información derivada de ese uso puede ser posteriormente incorporada a un SIG. 

EL GPS puede emplearse como una fuente de datos estática (se utiliza como 
herramienta para la creación de una capa de información geográfica y esta después 
se emplea en el SIG de la forma habitual), o bien para la obtención de datos en 
tiempo real. Los SIG sobre dispositivos móviles (véase el apartado 24.2) pueden 
aprovechar los receptores GPS que estos dispositivos habitualmente incorporan, 
y alimentarse con los datos de dichos receptores en tiempo real. 

Un caso particular de esto son los cada día más populares navegadores GPS. 
Estos dispositivos aúnan el receptor GPS y una aplicación de tipo SIG que presenta 
un visor y permite ejecutar un número reducido de procesos, en concreto los de 
cálculo de rutas óptimas entre dos puntos a través de una red de comunicación 
(apartado 19.4). Uno de los puntos (el de destino) es fijado por el usuario, mientras 
que el punto de origen es el punto actual en que se encuentra el dispositivo, que 
se obtiene a partir del GPS. 
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Como herramientas estáticas, el trabajo en campo con un GPS genera un 
conjunto de puntos o de trazados, que pueden fácilmente transferirse al ordenador 
para poder trabajar con ellos. Este trabajo puede realizarse dentro de un SIG, 
ya que, o bien este incluye la capacidad de importar los archivos generados por 
el GPS, o el software que acompaña a dicho GPS incorpora herramientas para 
ayudar en la comunicación entre SIG y GPS. 

Además de la información posicional que deriva del sistema GPS, los receptores 
GPS pueden incorporar elementos que permitan la entrada de la componente 
temática asociada a las distintas entidades, es decir, los atributos. Si solo se registra 
la componente espacial, la información que se almacena en el GPS es de mucha 
menos utilidad que si se acompaña de atributos. 

Las funcionalidades incorporadas en el receptor suelen ser sencillas, pero permi- 
ten que desde este se pueda llevar a cabo todo el proceso de creación de la capa que 
posteriormente se empleará en el SIG. El trabajo de campo incluye de este modo 
tanto el registro y creación de las entidades como la edición de las propiedades 
no espaciales de estos. Existe, no obstante, la posibilidad de completar la fase de 
introducción de atributos en el SIG, durante el trabajo en gabinete, lo cual en 
ocasiones resulta más sencillo y práctico. 

El volumen de trabajo que se requiere una vez que los datos han sido reco- 
gidos dependerá también de las necesidades de precisión que se presenten y del 
tipo de trabajo en que se enmarque dicha recogida de datos. La realización de 
correcciones y la edición avanzada de los datos no puede en ocasiones realizarse 
dentro de un SIG, ya que este no dispone de las herramientas necesarias para un 
tratamiento avanzado de los datos del GPS. El SIG está preparado para trabajar 
con las coordenadas que salen del GPS, pero este puede almacenar más datos 
(datos «en bruto»), que pueden procesarse en gabinete para la obtención de dichas 
coordenadas de forma más precisa. Para realizar esta tarea es necesario software 
especializado, y las funcionalidades del SIG se emplearán posteriormente, cuando 
ya se hayan verificado los datos del GPS y elaborado las capas correspondientes. 

Para el lector interesado, una referencia completa sobre el uso de GPS de cara 
a la integración de los datos en un SIG es [87] . En el ya mencionado apartado 24.2 
veremos con detalle la tecnología de los SIG móviles, un ámbito en el que SIG y 
GPS se unen para conformar herramientas conjuntas. 


6.7. Información Geográfica Voluntaria 

Hemos mencionado ya que los dispositivos tales como receptores GPS de bajo 
coste pueden emplearse para recoger información geográfica y crear datos geográfi- 
cos, y que cuando esto se une a los conceptos participativos de la denominada Web 
2.0, surgen iniciativas de gran interés en las que el usuario de a pie, sin necesidad 
de una formación específica como cartógrafo, puede aportar sus datos para que 
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otros los exploten posteriormente. Aunque no se trata de una fuente de datos como 
tal, y los elementos y dispositivos empleados ya los hemos visto a lo largo de este 
capítulo, el cambio que supone la inclusión de una filosofía acorde con las ideas de 
la Web 2.0 es tan notable que merece ser tratado por separado. No se trata de un 
cambio en la propia toma o preparación de datos, o de una tecnología nueva que se 
aplique a estos, sino de un cambio social y filosófico que redefine el propio concepto 
de la información geográfica en lo que a la creación del dato geográfico respecta, 
y cuyas consecuencias son ciertamente importantes, ya que abren el ámbito de la 
creación cartográfica a un nuevo y amplio grupo de personas. 

Se conoce como Información Geográfica Voluntaria o Participativa (en inglés 
Volunteered Geographical Information, VGI)[88] al uso de Internet para crear, 
gestionar y difundir información geográfica aportada voluntariamente por usuarios 
de la propia red. El conjunto de herramientas y técnicas que emplean esos usuarios 
para aportar su información conforma lo que se ha dado en llamar neogeografía. 
La comparación entre proyectos de creación de VGI y la bien conocida Wikipe- 
dia, tal y como se comentó en otro punto anterior en este mismo capítulo, sirve 
perfectamente para ilustrar qué es lo que entendemos por VGI y neogeografía. 

En el caso particular de esta última, la neogeografía ha supuesto un profundo 
cambio en algunas de las ideas básicas de la cartografía, modificando asimismo la 
concepción tradicional de la información geográfica, sus características o el papel 
que esta venía desempeñando en muchos ámbitos (o incluso dándole un papel 
en campos donde con anterioridad el uso de información geográfica era escaso) . 
Algunas de las ideas principales sobre la neogeografía son las siguientes: 

■ Popularización y democratización. La producción cartográfica ha estado 
siempre en manos de gobiernos u organismos, y en muchas ocasiones fuer- 
temente censurada debido a su elevado valor estratégico. Con la VGI, la 
creación de información geográfica se democratiza y se convierte en un 
proceso participativo libre y sin restricciones. Se invierte el esquema «hacia 
abajo» de producción y uso de información geográfica. 

■ Los ciudadanos se convierten en «sensores» y tienen mayor consciencia de 
su realidad geo-espacial. 

■ Se elimina parte del «misticismo» de la producción de información geográfica 

En parte, estas ideas son también comunes a otros fenómenos basados en la Web 

2.0, ya que todas se fundamentan en una mayor democratización de la información, 
sea esta geográfica o no. También se comparten algunos de los problemas o críticas 
que otros ámbitos han recibido al adoptar esquemas de producción similares. 
Por ejemplo, la calidad de la información es puesta en entredicho al promover la 
participación de todo tipo de personas, con independencia de su perfil. En el caso 
de la información geográfica, con una producción tradicionalmente como hemos 
dicho limitada a profesionales muy especializados, esto es especialmente relevante. 
Con la proliferación de la VGI, se da voz y poder sobre la información geográfica 
a individuos en gran medida sin formación, que no obtienen un beneficio tangible 
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obvio y no pueden aportar garantías de veracidad o autoridad alguna. Esto puede 
plantear dudas lógicas acerca de la conveniencia de usar esa información. 

No debe olvidarse no obstante, que la Web 2.0 también tiene sus mecanismos 
de regulación, y que en otros casos ya se ha demostrado que, para otros tipos de 
información, la calidad y rigor de esta no es inferior a la creada con esquemas más 
clásicos y menos abiertos. Un hecho particularmente curioso que tiene lugar a 
este respecto con la información geográfica es el relacionado con los denominados 
elementos trampa, y particularmente con el más popular de ellos, las calles trampa. 
Aunque se trata de una práctica negada por buena parte de los productores de 
cartografía, es sabido que estos introducen elementos erróneos (tales como una 
calle inexistente en un callejero) como medida para proteger sus derechos de autor 
y poder reconocer copias ilegales. En el caso de la VGI, puesto que no existe esa 
necesidad ya que la información generada y aportada por los voluntarios es libre, 
no existen este tipo de errores intencionados. La comparación de información 
geográfica clásica con VGI ha puesto de manifiesto que se trata de una práctica 
real que, obviamente, disminuye la calidad del dato geográfico. 

Por otra parte, el hecho de que se use equipo de bajo coste y los usuarios 
no sean técnicos especializados no es necesariamente un problema. Un usuario 
sin formación no está capacitado para efectuar un levantamiento topográfico 
preciso, pero sí para situarse delante de la puerta de una tienda y marcar su 
posición, añadiendo esta a un proyecto que catalogue los comercios de la zona y 
su localización. Este tipo de información geográfica, de puntos de interés muchas 
veces no recogidos en cartografía más especializada, constituye una gran parte de la 
VGI, y las metodologías e instrumental con que se crea son más que suficientes para 
otorgarle validez y precisión adecuada al uso del que posteriormente va a ser objeto. 

En resumen, la neogeografía es en la actualidad un fenómeno que no debe dejar- 
se de lado, ya que los proyectos que aglutina se están convirtiendo paulatinamente 
en proveedores fundamentales de datos cuya calidad en muchos casos es excelente. 

Aunque las hemos tratado dentro de este capítulo dedicado a las fuentes de datos, 
la VGI y la neogeografía tienen una indudable vinculación con todo lo desarrollado 
en la parte de este libro dedicada al factor organizativo, ya que se trata de un 
fenómeno social más que técnico. De igual modo, el capítulo 24, dedicado a los SIG 
móviles, está también muy relacionado con ambas, puesto que son los dispositivos y 
aplicaciones que veremos entonces, así como los servicios sobre ellos, los que han po- 
sibilitado el desarrollo de la neogeografía y la abundante producción actual de VGI. 


6.8. Sobre cartografía de elevaciones 

La cartografía de elevaciones es probablemente la de mayor importancia de 
entre todas las que se emplean de forma habitual dentro de cualquier proyecto 
SIG. Su relevancia deriva del hecho fundamental de que la practica totalidad de 
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procesos que se estudian en un SIG tienen algún tipo de componente relacionada 
con el terreno y su relieve, y por tanto puede obtenerse amplia información sobre 
dichos procesos a partir de una capa con datos de elevación. 

Como dato relevante, dedicaremos en este libro un capítulo entero, el 15, al 
conjunto de operaciones de análisis basadas en el MDE, que van desde el simple 
cálculo de pendientes hasta la extracción de parámetros más complejos, pasando 
por la definición del comportamiento hidrológico de una zona según las caracterís- 
ticas de su relieve, entre otros. Asimismo, gran número de otras formulaciones que 
veremos en la parte dedicada a procesos tienen su principal aplicación sobre datos 
de elevación, en particular los métodos de interpolación que veremos en el capítulo 
13, y que nos permitirán crear cartografía de elevaciones en formato ráster. Este es, 
como veremos, el formato preferido para el análisis de la cartografía de elevaciones, 
ya que ofrece un mayor abanico de posibilidades frente a otros. 

Aunque el formato ráster es el más indicado para llevar a cabo los análisis co- 
rrespondientes, la cartografía de elevaciones puede crearse originalmente con muy 
diversas características. De igual modo, y debido también a la gran importancia de 
este tipo de capas, su origen puede ser muy variado, ya que son muchas las técnicas 
distintas que existen para su creación. Es de interés, por tanto, exponer en este ca- 
pítulo sobre fuentes de datos algunas de las ideas principales relativas a la creación 
de capas de elevaciones, las características de estas o las ideas fundamentales que 
residen tras las metodologías más importantes. Posteriormente, esto nos ayudará 
a entender mejor las restantes formulaciones y conceptos relativos al manejo y 
análisis de este tipo de cartografía, abundantes en este libro como ya se ha dicho. 

A modo de resumen, he aquí una lista de metodologías a partir de las cuales 
puede obtenerse cartografía de elevaciones, gran parte de las cuales han sido 
tratadas con detalle antes en este mismo capítulo. 

■ GPS. Como ya sabemos, un GPS toma datos no solo de la posición que 
ocupa en coordenadas x e y, sino también su elevación. La utilización de 
GPS permite obtener una nube de puntos de elevación, aunque si esta ha 
de cubrir un territorio amplio y con cierta precisión en las medidas, resulta 
poco idóneo el trabajar con esta tecnología, ya que es costoso en tiempo. Es 
más adecuada para obtener levantamientos precisos de áreas más reducidas, 
donde se demuestra como una herramienta sumamente eficaz. 

■ Digitalización de curvas de nivel. En ocasiones la cartografía de eleva- 
ciones ya existe, aunque no en el formato adecuado para su empleo en un SIG. 
Ya conocemos los métodos de digitalización de entidades, tanto manuales 
como automáticos, y ya sea en pantalla o en equipo especializado, y mediante 
ellos podemos digitalizar las curvas de nivel, obteniendo una capa de líneas 
con la información altitudinal que contiene un mapa topográfico habitual. 

■ Estereografía. A partir de pares estereoscópicos, y con el concurso de una 
estación fotogramétrica digital pueden delinearse líneas o puntos de una 
elevación dada, digitalizando así la información altimétrica. El procedimiento 


Fuentes principales de datos espaciales 


175 


es similar a la simple digitalización de curvas de nivel, solo que en este caso 
estas no están presentes explícitamente en las imágenes de partida, y se 
infieren a partir de la visualización tridimensional de las mismas. 

■ Interferometría. La interferometría es una técnica cuyos fundamentos 
son en cierta medida similares a los de la estereografía, pues se basan en 
la información recogida de un punto concreto desde dos puntos distintos. 
Si en el caso de emplear simples imágenes esto permitía crear una imagen 
tridimensional, en el caso de la interferometría el estudio de las diferencias 
de fases entre las ondas recibidas en dos puntos distintos permite el cálculo 
de distancias. Se trata, por tanto, de un proceso automatizado, que requiere 
menos intervención que en el caso de la restitución fotogramétrica. 

Un uso muy habitual de esta técnica es con los denominados Radares de 
Apertura Sintética 25 , utilizado por ejemplo en el caso de la misión SRTM, que 
reseñamos anteriormente como producto importante. La medición desde dos 
puntos puede hacerse con dos pasadas de satélite (caso por ejemplo del ERS) 
o bien en una sola si la plataforma dispone de dos receptores separados una 
cierta distancia (caso del SRTM). En [89] puede encontrarse una descripción 
detallada de este tipo de técnicas y las etapas que comprenden. 

■ LiDAR. La técnica más avanzada en la actualidad es el uso de aparatos 
de altimetría basados en láser, como el LiDAR, que ya hemos visto en este 
mismo capítulo. El LiDAR ofrece posibilidades muy interesantes tales como 
la obtención de MDE y MDS (Modelo Digital de Superficie) por separado. 
El resultado de un trabajo con LiDAR es una nube de puntos, normalmente 
en un número muy elevado debido a la precisión del instrumento, la cual 
puede emplearse para crear otro tipo de capas, tales como capas ráster. El 
nivel de postproceso que se requiere para la obtención final de una capa es 
mucho menor que con otras técnicas. 

A la hora de plantear un proyecto SIG, debe elegirse entre estas fuentes, tanto si 
se desea adquirir la cartografía ya elaborada como si se desea crearla a partir de otras 
fuentes. La variedad de opciones existentes es grande, y cada una de ellas tiene sus ca- 
racterísticas peculiares. Para saber más al respecto, algunas referencias donde puede 
encontrarse una comparación entre las metodologías anteriores son [90], [91] y [92], 


6.9. Formatos de archivo 

Como hemos visto, las fuentes de datos son muy variadas, y a la hora de 
elaborar un proyecto SIG podemos recoger datos de muchas procedencias distintas. 
Conocer todas estas fuentes de datos es importante para elaborar una base de 
datos geográfica que permita obtener los mejores resultados posibles, pero también 
lo es el conocer la forma en que esos datos pueden obtenerse. Los datos geográficos 

25 Synthetic Aperture Radar (SAR) 
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se van a almacenar en archivos, existiendo muchos formatos de archivo distintos 
para recoger un mismo conjunto de datos. 

Estos archivos son la materialización de los modelos de almacenamiento que 
veíamos en el apartado 5.4, y su existencia obedece a distintas razones. Pueden 
haber sido definidos por alguna casa comercial para ser utilizados en su software, 
por un colectivo, o bien pueden ser estándares internacionales definidos para tratar 
de homogeneizar la forma en que se presentan los datos dentro de un determinado 
ámbito de trabajo. 

Datos de una misma procedencia pueden presentarse de forma distinta si se 
emplean diferentes formatos de archivo. Las circunstancias por las cuales se opta 
por uno u otro formato pueden basarse únicamente en el hecho de que el software 
empleado soporte o no dicho formato, pero deberían fundamentarse en las propias 
características del formato y lo adecuadas que estas son para recoger la información 
con la que trabajamos. 

La existencia de muchos formatos de archivo dificulta el trabajo con los datos 
en un SIG, principalmente porque ningún SIG implementa la capacidad de po- 
der «leer» todos los formatos existentes. La interoperabilidad y la comunicación 
entre distintos SIG, o incluso entre un SIG y otras aplicaciones (bases de datos, 
aplicaciones para manejo de imágenes, aplicaciones CAD) no es completa, y el 
aprovechamiento de todos los datos disponibles dentro de un proyecto requiere 
normalmente tiempo para la gestión adecuada de datos en formatos variados. 

Un problema más serio, no obstante, es el desconocimiento por parte de los 
usuarios de las implicaciones que tiene el uso de uno u otro formato, ya que en 
ocasiones no permiten aprovechar de modo pleno los datos de que se dispone. Por 
ejemplo, dentro de un SIG es habitual emplear datos procedentes de CAD. Los 
datos en un CAD se almacenan en formatos de datos definidos por esas aplicaciones 
CAD, los cuales han sido definidos para satisfacer las necesidades del ámbito de 
trabajo en el que se han desarrollado (el diseño asistido por ordenador). Aunque los 
SIG pueden leer esos formatos de archivo y se encuentra información muy valiosa 
almacenada en ellos, no son ideales para el manejo de capas de datos SIG (en este 
caso, capas vectoriales), y es importante conocer este hecho. 

La existencia de librerías que actúan a modo de interpretes facilita el desarrollo 
de aplicaciones SIG con capacidades de lectura y escritura en muchos formatos 
distintos, pero aún así se requiere un cierto grado de comprensión de estos por 
parte del usuario. 

Debemos pensar asimismo que los formatos de archivo no solo se emplean 
en un proyecto SIG para los datos de entrada, sino también para almacenar los 
resultados que se generan a lo largo de ese proyecto. Estos datos serán utilizados 
en el propio SIG en otras ocasiones posteriores, o bien en otros programas. De 
este modo, tomamos datos que pueden provenir de aplicaciones y fuentes diversas, 
pero también «damos» datos a esas aplicaciones, por lo que la comunicación 
es bidireccional. Puesto que es a través de archivos como dicha comunicación 


Fuentes principales de datos espaciales 


177 


se produce, y estos tienen que tener un formato dado, el conocimiento de estos 
formatos mejora tanto esa comunicación como la potencialidad de nuestros datos 
para todo tipo de uso, ya sea dentro o fuera de un SIG. 

En esta sección no se pretende describir todos los formatos existentes, ya 
que estos son demasiados y ello no tendría sentido. Se describirán solo los más 
populares (que no siempre han de ser necesariamente los mejores) para que el lector 
obtenga un conocimiento general de cómo se van a presentar sus datos, y a través 
de estos formatos se describirán los principales enfoques existentes, que son los 
que realmente ha de conocer un usuario de SIG para saber discernir si un formato 
es o no adecuado para sus datos y las operaciones que quiere aplicar sobre ellos. 

Junto con estos formatos de archivo, en el capítulo 32 se presentan los estándares 
de datos, que también se emplean para el intercambio y almacenamiento de datos 
SIG, y que presentan una relación estrecha con el contenido de esta sección. El capi- 
tulo 8, que veremos dentro de esta misma parte, también guarda relación con este 
apartado, pues estudia las diferentes formas en que los SIG han solucionado a lo lar- 
go del tiempo el acceso a los datos, incluyendo entre ellas el acceso directo a archivos. 

6.9.1. Formatos para datos ráster 

Los formatos de archivo para datos ráster son muy abundantes, existiendo 
numerosas alternativas con diferencias en ocasiones notables entre sí. Debido a que 
uno de los datos ráster más habituales en un SIG son las imágenes, a los formatos 
de datos específicos para datos ráster hay que sumar aquellos ya existentes para 
el almacenamiento de imágenes, que son de por sí muy variados. Estos formatos, 
adaptados a la naturaleza particular de las imágenes de un SIG, pueden emplearse 
para almacenar datos ráster y son de hecho de uso habitual en el ámbito de los 
Sistemas de Información Geográfica. 

Formatos para imágenes 

Como ya sabemos, las imágenes son un tipo de dato muy habitual en un SIG, 
y estas se corresponden con el modelo de datos ráster. Por ello, los formatos 
de archivo empleados para el almacenamiento de imágenes digitales se emplean 
también para las imágenes particulares que utilizamos en un SIG (por ejemplo, 
fotografías aéreas o mapas escaneados, según vimos antes en este mismo capítulo), 
e incluso para otros datos ráster que no son imágenes como tales, como por ejemplo 
un Modelo Digital de Elevaciones. 

Los formatos de archivo para imágenes son adecuados para recoger los colores 
de las imágenes, pero esto no es suficiente a la hora de almacenar otros valores (por 
ejemplo, valores decimales) o bien cuando son necesarios un número más elevado 
de bandas, como en el caso de imágenes hiperespectrales. 

Una imagen en blanco y negro o en escala de grises contiene una banda. Una 
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imagen en color contiene tres, ya que los colores se expresan como una terna de 
colores básicos: rojo, verde y azul. Este es el fundamento del modelo de color RGB, 
en el cual todo color es la combinación de distintas intensidades de los anteriores 
colores básicos. Las intensidades de cada banda (o las intensidades de la única 
banda en el caso de una imagen en escala de grises) se expresan habitualmente 
con valores entre 0 y 255, un rango que resulta insuficiente para el manejo de otras 
variables tales como las variables físicas que pueden emplearse en un SIG, ya que 
estas presentan valores continuos. 

En estos casos, los formatos de imágenes no son adecuados en su forma original, 
y deben o bien adaptarse o bien emplearse formatos más específicos que tengan 
en cuenta el tipo particular de imágenes que se almacenan. 

Otro problema es la presencia de celdas sin datos. La existencia de celdas sin 
datos es un hecho que no contemplan los formatos de imágenes. A estas celdas 
se les asigna un valor establecido por defecto, el cual ha de definirse en el propio 
archivo para que después sea reconocido por el SIG (para que sepa que, donde 
aparezca ese valor, realmente no existen datos), pero muchos formatos de imagen 
no puede almacenarlo. Una posible solución es la utilización de formatos que 
permitan transparencia. En estos, se puede especificar un color como transparente, 
que a efectos de su utilización en un SIG puede considerarse como indicación de 
la ausencia de datos. Estos formatos, no obstante, no son los más adecuados para 
datos SIG, y esta solución no resuelve por completo esta deficiencia. 

Otra deficiencia de los formatos de imágenes es que no pueden recoger la 
referencia geográfica de la imagen. Salvo que las imágenes sean utilizadas en un 
SIG, no hay necesidad de que estas contengan información tal como el tamaño 
de píxel (los metros que cada píxel representa en la realidad) o las coordenadas de 
la zona que recogen. Por ello, las definiciones de los formatos de imagen, al estar 
pensadas para recoger meras imágenes digitales (y no imágenes de satélite o aéreas 
destinadas a un análisis espacial), no tienen en cuenta estas necesidades. 

Una forma habitual de resolver esto es acompañar cada fichero de imagen 
con un pequeño fichero de texto plano donde se contengan los datos geográficos 
correspondiente a la imagen. Este fichero se denomina World File , y tiene una 
forma como la siguiente: 

1.0 

0.0 

0.0 

- 1.0 

691200.0 

4576000.0 

El significado de las anteriores líneas es el siguiente: 

■ Línea 1 . Tamaño de celda en la dirección Este-Oeste 
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■ Líneas 2 y 3. Ángulos de rotación del plano respecto a los ejes X e Y. Estos 
valores son siempre iguales a cero. 

■ Línea 5. Tamaño de celda en la dirección Norte-Sur, con signo negativo 

■ Líneas 6 y 7. Coordenadas x e y del píxel superior izquierdo de la imagen. 

Este World File tiene el mismo nombre que el archivo de imagen, y su extensión 

se forma con la primera y la última letra de la extensión de dicho archivo, y la letra 
w. Así, para un archivo imagen.tif, se tendrá un archivo imagen. tfw. Cuando 
el SIG abre la imagen, busca dicho fichero y, en caso de existir este, toma de él la 
información que necesita para poder incorporar la imagen al SIG de forma completa, 
de tal modo que sobre ella puedan llevarse a cabo análisis espaciales u operaciones 
como la digitalización en pantalla (heads-up) que hemos visto anteriormente. 

Por último, un aspecto importante de los archivos de imagen es el tipo de 
compresión que utilizan. Las imágenes con las que se trabaja en un SIG pueden 
ser muy voluminosas, y para almacenarlas es necesaria gran cantidad de espacio 
(puede ser del orden de gigabytes para el caso de imágenes de alta resolución). 
Por esta razón, los formatos de imagen, especialmente los que han sido creados 
específicamente para imágenes SIG, incluyen algún método de compresión para 
disminuir el volumen del archivo. 

En el apartado relativo a los modelos de almacenamiento vimos algunas ideas 
sobre compresión, presentando la codificación run-length. Esta es una estrategia 
para almacenar la información de forma que se minimice el tamaño de los datos 
necesarios, y en base a los datos recogidos puede recuperarse toda la imagen de 
forma exacta. Es decir, la utilización de estas formas de compresión no supone una 
degradación de la información contenida en la imagen, y nada de esta se pierde en 
el proceso. Podemos comprimir y descomprimir la imagen tantas veces como quera- 
mos, y el resultado siempre será el mismo, fiel a la imagen original. Un formato de 
archivo que cumple esto se dice que emplea un método de compresión sin pérdidas. 

Por el contrario, existen otros métodos de compresión con pérdidas , en los cuales 
se pierde información y la imagen resultante, además de ocupar menos espacio, tie- 
ne una menor calidad y no es exactamente igual a la original, sino simplemente muy 
similar a esta. Los algoritmos de compresión con pérdidas toman de la imagen ori- 
ginal la información más importante para después recrear esta, ignorando la menos 
relevante, que se pierde en aras de obtener un menor volumen de almacenamiento. 

Siempre que sea posible, los formatos de compresión sin pérdidas deben pre- 
ferirse frente a los que utilizan algoritmos de compresión son pérdidas, ya que 
no se pierde información alguna con ellos. En función de las necesidades que se 
tenga con respecto a las imágenes a almacenar, debe elegirse el formato adecuado, 
considerando siempre la degradación que la compresión con pérdidas implica. 

Algunos formatos de imagen que emplean compresión con pérdidas son alta- 
mente populares, ya que se emplean para tareas donde la reducción de tamaño de 
los ficheros es prioritaria, y este tipo de compresión ofrece una reducción en general 
mayor que la de los algoritmos sin pérdidas. Así, por ejemplo, las imágenes que se 
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Figura 6.21: Efectos de la utilización de algoritmos de compresión con pérdidas, a) 
Imagen original, b) Imagen almacenada mediante compresión con pérdidas, c) Imagen tras 
diez procesos de lectura y almacenamiento en un formato de archivo con compresión con 
pérdidas. El efecto de la degradación sucesiva que la imagen sufre es claramente apreciable. 


incorporan en paginas Web han de ser de pequeño tamaño para agilizar su carga, y 
ese tamaño resulta un factor decisivo, especialmente donde la velocidad de conexión 
es limitada. Para el trabajo con un SIG, no obstante, la calidad de la imagen es 
de mucho mayor importancia que su tamaño, y los formatos de compresión sin 
pérdidas responden mejor a las necesidades del almacenamiento de datos SIG. 

En la imagen 6.21 puede verse el efecto de la utilización de compresión con 
pérdidas. 


Formatos para datos SIG 

Junto con los formatos de archivo para imágenes, los SIG ráster han desarrollado 
sus propios formatos para el almacenamiento de capas ráster en general, y en parti- 
cular de aquellas que no representan imágenes, tales como capas de variables físicas. 

Estos formatos están pensados para las características de estas capas, que 
habitualmente recogen valores decimales (a diferencia de los valores enteros de los 
Niveles Digitales de una imagen) , y que no suelen contener más que una única banda. 

Además de corresponder a un SIG particular (prácticamente cada SIG tiene 
su propio formato de archivo ráster), otras aplicaciones que trabajan con este tipo 
de datos, tales como todas aquellas que usan por una u otra razón información de 
elevaciones, también disponen de sus formatos particulares. Muchos SIG pueden 
leer algunos de estos formatos junto con los suyos propios o los de otros SIG. 

A la hora de almacenar una capa tal como un Modelo Digital del Terreno o 
cualquier otra de similar índole, estos formatos son preferibles en general a las 
imágenes, ya que los formatos de imagen, aunque ya hemos visto que pueden 
adaptarse y ser en algunos casos plenamente operativos para otro tipo de variables, 
no son formatos puramente pensados para este tipo de información. 
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Principales formatos existentes 

Dentro de la gran variedad de formatos existentes, he aquí una breve lista de 
los principales, los cuales suelen encontrarse con frecuencia a lo largo del desarrollo 
de un proyecto SIG habitual. 

Dentro de los formatos para imágenes, cabe destacar los siguientes: 

■ Tagged Image File Format (tif) . Se trata de un formato complejo y 
altamente flexible, con muchas variantes distintas. Puede incorporar tanto 
compresión con pérdidas como sin pérdidas, en función del algoritmo que 
se utilice. Se utiliza habitualmente tanto en el ámbito del tratamiento de 
imágenes como en el ámbito SIG. En este último, permite también el alma- 
cenamiento de valores decimales, siendo apto para almacenar capas que no 
representen imágenes como tal. Es un formato habitualmente generado por 
los escáneres, con lo cual es frecuente su utilización al trabajar con cartografía 
escaneada, según vimos antes en este mismo capítulo. Existe una variante 
denominada GeoTIFF, que permite incorporar en el propio fichero la georre- 
ferencia de la imagen, haciendo innecesario el uso de un World File asociado. 

■ Joint Photographic Experts Group (jpg o jpeg). Un formato muy 
popular para imágenes (todas las cámaras digitales lo utilizan) , no es sin 
embargo adecuado para el trabajo con SIG. Incorpora compresión con 
pérdidas (el ejemplo de la figura 6.21 ha sido realizado utilizando este 
formato) , y no es apto para almacenar capas ráster que no sean de tipo imagen. 

Algunos formatos específicos para imágenes SIG tales como imágenes de satélite, 
son: 

■ Enhanced Compression Wavelet (ecw). Formato desarrollado por 
Earth Resource Mapping. Al igual que el siguiente, está especialmente 
preparado para almacenar imágenes de gran tamaño, ya que las imágenes 
aéreas o de satélite en general tiene tamaños mayores que las imágenes de 
uso genérico para las que están pensados los formatos como TIFF o JPEG. 
En el uso de estas imágenes de gran tamaño en un SIG, es habitual que 
se quiera acceder a la imagen (por ejemplo para su visualización) solo en 
una parte determinada de la misma. Para optimizar este tipo de acceso, 
el formato soporta acceso sin necesidad de descomprimir la totalidad del 
archivo (descompresión selectiva). Se trata de un formato de compresión 
con pérdidas, y su grado de compresión es alto. 

■ Multi— resolution Seamless Image Database (MrSID) (sid). Al con- 
trario que el anterior, que es un formato abierto, el formato MrSID es un forma- 
to cerrado, pero sus características son similares: alta compresión, preparado 
para imágenes de gran volumen y con posibilidad de descompresión selectiva. 

Por último, entre los formatos para datos ráster (no imágenes) más comunes 
destacar el siguiente: 
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■ Arclnfo ASCII (ase). Un formato en texto plano ASCII 26 . Únicamente 
soporta una única banda, y permite almacenar el valor a considerar como 
valor de sin datos. 

6.9.2. Formatos para datos vectoriales 

Sin ser tan abundantes como los formatos para datos ráster, existe también 
un buen número de formatos de archivo para datos vectoriales. Al igual que en 
el caso ráster, estos formatos de archivo no derivan únicamente de los SIG, sino 
también de otras aplicaciones que utilizan capas de tipo vectorial, con particular 
importancia de las de diseño asistido por ordenador (CAD). 

A la hora de definir las características de un formato de archivo para datos 
vectoriales, encontramos dos aspectos principales, a saber: 

■ Capacidad para recoger la topología de la capa 

■ Capacidad para recoger los atributos de las entidades. 

En el primer aspecto, debemos considerar que existen SIG no topológicos, es 
decir, que no son capaces de manejar información sobre la topología de la capa, 
y por tanto no la necesitan. Los formatos de archivo de estos SIG no estarán por 
tanto pensados para trabajar con topología, y por ello no la almacenan. 

Respecto a la capacidad para recoger los atributos de una capa, este aspecto 
afecta principalmente a los formatos propios de las aplicaciones CAD. En estas, la 
componente espacial es la que prima, no teniendo tanta relevancia la componente 
temática. Los puntos, líneas y polígonos con los que se trabaja en un CAD no tiene 
atributos asociados salvo aquellos relacionados con su propia representación tales 
como color, grosor o estilo. Existen formas de asociar una componente temática a 
esas entidades, pero estas son variadas y la interoperabilidad disminuye en caso de 
emplearlas, ya que no están soportadas con carácter general en los distintos SIG. 

Por esta razón, estos formatos son aptos para introducir información dentro de 
un SIG o para exportarla a un CAD con objeto de utilizar capacidades de este que no 
se tengan en el SIG, pero como formatos de almacenamiento de datos dentro de un 
SIG no son los más idóneos, y debe optarse por otros más específicos para datos SIG. 

Principales formatos existentes 

Los formatos más extendidos para datos SIG vectoriales son los siguientes: 

■ Shapefile (shp). Propuesto por la empresa ESRI, es el formato más utiliza- 
do en la actualidad, convertido en un estándar de fado. No soporta topología 
y se compone de diversos ficheros, cada uno de los cuales contiene distintos 
elementos del dato espacial (geometrías, atributos, índices espaciales, etc.) 

26 American Standard Code for Information Interchange. Un esquema de codificación de 
caracteres ampliamente utilizado. 


■ Spatialite. Una extensión espacial para la base de datos SQLite. Se trata de 
una base de datos, pero no tiene la arquitectura clásica de esta, con aplicación 
cliente y un servicio que provee los datos (lo veremos con más detalle en el 
capítulo 8), sino que toda ella se encuentra almacenada en un fichero que 
puede copiarse o eliminarse de la forma habitual. 

■ GeoJSON. Un formato de texto plano basado en notación JSON 27 , de 
uso extendido debido a su simplicidad. Existe una variante denominada 
TopoJSON, que permite el almacenamiento de topología. 

6.10. Resumen 

Los datos con los que trabajamos en un SIG pueden venir de muy distintas 
procedencias. Distinguimos aquellos que provienen directamente de algún tipo 
de medida o del empleo directo de alguna instrumentación (fuentes de datos 
primarias) , y otros que proceden de procesar un dato ya existente para adaptarlo 
a su uso en un SIG (fuentes de datos secundarias). 

Una forma básica de crear datos espaciales digitales es la utilización de fuentes 
no digitales y su digitalización. Este proceso puede llevarse a cabo tanto de forma 
manual como automatizada, y puede dar como resultado tanto capas ráster como 
capas vectoriales. 

La teledetección es una fuente de datos de gran importancia para los SIG. 
Dentro de ella se incluyen técnicas de muy diversa índole cuyos productos son 
muy distintos entre sí. El fundamento de la teledetección es la medición de las 
propiedades de los objetos realizada sin que medie contacto con estos. Para ello, 
se emplean sensores que pueden ir a bordo de aviones o montados sobre satélites, 
y que pueden ser de tipo pasivo o activo. El resultado del proceso de teledetección 
son imágenes con un número variable de bandas, aunque tecnologías como el radar 
o el LiDAR pueden emplearse para la generación de cartografía de elevaciones. 

Dentro de las tecnologías que permiten la recogida de datos en campo, el GPS 
ha supuesto un cambio en la realización de este tipo de trabajos, y su integración 
en SIG es sencilla. Esto les ha convertido en una fuente de datos muy utilizada 
en un gran número de proyectos SIG. 

Independientemente de su origen, los datos espaciales se almacenan en archivos 
cuyos formatos son a su vez muy variados. En este capítulo hemos visto algunos 
de los más habituales, así como los aspectos más importantes que los definen, y 
que han de tenerse en cuenta a la hora de trabajar con dichos formatos y elegir 
los más adecuados. 
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Capítulo 7 


La calidad de los datos espaciales 


Todo dato espacial contiene algún tipo de error, en mayor o menor medida. Conocer las 
razones por las cuales aparecen esos errores es importante para poder evaluar correctamente 
la validez del trabajo que realizamos con los datos y los resultados que obtenemos a partir 
de ellos. En este capítulo se estudiaran los principales errores que pueden afectar a los 
distintos tipos de datos espaciales, las fuentes principales de dichos errores y las maneras 
en que estos pueden gestionarse dentro de un proyecto SIG. 

Puesto que los datos son la materia prima para obtención de nuevos datos a través de los 
procesos y operaciones que dentro de un SIG realizamos con ellos, trataremos también la for- 
ma en que los errores en los datos de partida afectan a los resultados que derivemos de ellos. 


7.1. Introducción 

Puesto que los datos son la base de todo el trabajo que realizamos en un SIG, 
su calidad es vital para que ese trabajo tenga sentido y aporte unos resultados cohe- 
rentes y útiles. Siendo la calidad el conjunto de propiedades y de características de 
un producto o servicio que le confieren su aptitud para satisfacer unas necesidades 
explícitas e implícitas [93] , desde el punto de vista del SIG unos datos espaciales de 
calidad serán aquellos que puedan servir para alcanzar los objetivos de un proyecto 
concreto, dando sentido a este. En este aspecto, se debe considerar la disposición 
de los datos per se, aunque también las necesidades a las que pretendemos dar 
respuesta mediante los datos que utilizamos. 

Por definición, ningún dato es perfecto. Todo dato que utilicemos va a contener 
errores, y estos pueden ser desde totalmente irr elevantes para el desarrollo de 
un proceso de análisis hasta de tal magnitud que desvirtúen por completo los 
resultados de dicho análisis. Es importante no solo contar con datos de calidad 
en los que estos errores sean mínimos, sino conocer el tipo de error que existe en 
nuestros datos y la magnitud de estos. Saber gestionar el error y ser consciente 
de las limitaciones de los datos de los que se dispone es importante para saber- 
interpretar los resultados derivados del trabajo con dichos datos. 

A lo largo de este capítulo veremos los aspectos más importantes que derivan 
de considerar el error como parte inevitable de nuestro trabajo con datos espaciales. 
Ello nos permitirá saber evaluar las capacidades de los datos para servir como 
punto de partida de nuestro trabajo, y a llevar este a cabo de la mejor manera 
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posible, considerando que se trabaja simultáneamente con un conjunto de datos 
y con un error implícito asociado a estos. 

[94] apunta las siguientes etapas para la modelación del error: 

■ Identificación de la fuente de error. 

■ Detección y medida del error. 

■ Modelación de la propagación del error. 

■ Propuestas de estrategias para la gestión y reducción del error. 

Será sobre estas distintas fases sobre las que trataremos en las próximas 
secciones. 

7.2. La importancia de la calidad de los datos 

A pesar de su gran importancia, la calidad de los datos espaciales no ha sido 
una preocupación hasta hace relativamente poco tiempo. Los textos sobre Sistemas 
de Información Geográfica tales como este mismo libro apenas trataban el tema 
en sus inicios [95, 96], y solo en la actualidad aparece una concienciación acerca 
de la importancia que la calidad de los datos espaciales tiene sobre el desarrollo 
de cualquier trabajo basado en ellos. 

Las razones por las que la calidad de los datos empieza a considerarse como un 
elemento de gran relevancia en el ámbito geográfico son principalmente dos [96] : 

■ Aparición de los SIG. 

■ Amplio crecimiento del volumen de datos espaciales disponibles, especial- 
mente los derivados de satélites. 

Estos dos factores, inevitablemente unidos, han favorecido que el volumen de 
trabajo sobre datos espaciales sea mayor y que además se use un número más 
elevado de datos distintos. Es lógico pensar que, a raíz de esto, haya surgido el 
interés por evaluar y tratar de forma rigurosa las condiciones en las que estos 
trabajos se están llevando a cabo. 

La preocupación por la calidad de los datos es básica por el simple hecho de 
que datos de mala calidad generan invariablemente resultados de mala calidad. 
Utilizar un dato de mala calidad es equivalente a utilizar un modelo equivocado. 
Si el modelo no es cierto, no importa la buena calidad de los datos, ya que los 
resultados que arrojará tampoco lo serán. Del mismo modo, un dato con un error 
superior al que puede resultar tolerable para una determinada tarea hace que la 
calidad de este sea insuficiente, y los resultados obtenidos carecen de valor. 

A pesar de que la aparición de los SIG ha sido una de las razones principales para 
que se tenga en consideración la calidad de los datos y se especifique formalmente el 
modo de tratarla y gestionarla, los SIG en sí no disponen apenas de herramientas pa- 
ra asistir en estas tareas. Aunque la ciencia de la información geográfica ha avanzado 
mucho en ese sentido, y el conocimiento relativo a la calidad de los datos espaciales 
es mucho mayor, los SIG no han incorporado ese conocimiento, y carecen de fundo- 
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nalidades al respecto. Dicho de otro modo, existen las formulaciones y los elementos 
teóricos, pero estos aún no se han visto materializados (o lo han hecho de forma 
prácticamente anecdótica) en los SIG de uso habitual. Por esta razón, la mayoría de 
usuarios de SIG no tienen en cuenta rigurosa y formalmente la calidad de los datos a 
la hora de desarrollar su trabajo, quedando aún mucho por avanzar en este sentido. 

Un elemento clave para el control de la calidad es la existencia de metadatos, 
que informan acerca de dichos datos sobre una serie de aspectos relativos a estos, 
entre ellos aquellos que afectan a la calidad. Los metadatos se tratan con gran 
profundidad dentro de este libro en el capítulo 31. 


7.3. Conceptos y definiciones sobre calidad de datos 


Antes de entrar en el estudio directo de la calidad de los datos espaciales y 
el estudio de los errores que pueden presentarse en un dato espacial, es necesario 
definir algunos conceptos básicos y alguna terminología al respecto. 

El concepto básico es el error, que no es sino la discrepancia existente entre 
el valor real (puede ser un valor de posición, de un atributo, o cualquier otro), y el 
valor recogido en una capa. El error puede ser de dos tipos: sistemático y aleatorio. 

Dos términos importantes en el estudio de la calidad son la precisión y exactitud. 
La precisión indica el nivel de detalle con el que se recoge la información. Un capa 
en la que las posiciones se han medido con 5 valores decimales es más precisa que 
una en la que se han medido con un único decimal. 



Figura 7.1: Diferencia entre precisión y exactitud (Tomado de [15]). En a) y b) la 
precisión es elevada, mientras que en c) y d) es baja. Por su parte, en a) y c) la exactitud 
es baja, siendo alta en b) y d) . 

Dependiendo del uso que se pretenda dar a una capa de datos geográficos, se 
requerirá una u otra precisión. Un trabajo geodésico requerirá medir la localiza- 
ción de un punto con precisión milimétrica, mientras que para un muestreo para 
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inventario forestal es suficiente localizar las parcelas correspondientes con una 
precisión mucho menor. 

Por su parte, la exactitud nos indica el grado en que los valores estimados se 
asemejan al valor real. 

La exactitud se calcula con el error sistemático, mientras que la precisión se 
calcula a partir del error aleatorio. Existe una relación directa entre precisión y 
exactitud, y en ocasiones se emplean ambos términos indistintamente. Si no existen 
errores sistemáticos (no existe un sesgo), la precisión y la exactitud son iguales. 

Es posible, no obstante, que un dato sea muy preciso pero poco exacto, ya que 
las magnitudes de los distintos tipos de errores pueden ser muy distintas. Este 
hecho puede verse claramente en la figura 7.1. 

Por último, un parámetro relativo al error es la incertidumbre. Habitualmente, 
el valor real es desconocido, por lo que el error no puede conocerse. La incertidumbre 
refleja la medida en que no podemos tener certeza de la validez de nuestros datos. La 
incertidumbre es un concepto más amplio que el error, y aúna tres componentes [97] : 

■ Error 

■ Vaguedad. Aparece como consecuencia de definiciones pobres o incompletas, 
así como cuando los objetos que se modelizan en los datos no presentan límites 
bien definidos. Por ejemplo, en una capa de clases de vegetación, la transición 
entre una clase y otra se produce normalmente de forma gradual, por lo que 
el establecimiento de una frontera brusca es un hecho artificial que aumenta 
la incertidumbre, y el significado de que un punto en concreto se asigne a una 
clase dada es más vago cuanto más cerca de esa frontera nos encontramos. 

■ Ambigüedad. Cuando no existen definiciones inequívocas de los conceptos 
fundamentales, aparecen ambigüedades que añaden igualmente incertidum- 
bre al dato creado en función de estos. 

Tradicionalmente se ha trabajado con el error y no con el concepto de incer- 
tidumbre, pero conocer esta es igualmente importante a la hora de evaluar la 
calidad de los datos, y la modelización de la incertidumbre es una alternativa a 
la modelización del error. 


7.4. Fuentes y tipos de errores 

Cuando un dato espacial llega a nosotros para ser empleado en un SIG, ha pasado 
por una serie de etapas a lo largo de los cuales puede haber incorporado errores. Estu- 
diando esas etapas por separado, encontramos las siguientes fuentes de error [98, 15] : 
■ Errores de concepto y modelo. Al recoger la información espacial uti- 
lizamos algún modelo de representación (ráster, vectorial), el cual siempre 
tiene alguna deficiencia. La realidad y las tareas que pretendemos realizar 
con una capa de información espacial no se adaptan por completo a ninguno 
de los modelos de representación, y el hecho de optar por uno u otro conlleva 
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la introducción de algún error, o condiciona para la aparición de unos u otros 
errores en las etapas posteriores. 

■ Errores en las fuentes primarias. El dato vectorial del que disponemos 
proviene originariamente de una fuente primaria, la cual puede contener 
errores. Si esta fuente contiene errores, estos aparecerán también en los datos 
que se deriven de este. Así, si digitalizamos en base a un mapa escaneado 
y la hoja original es errónea, también lo serán las capas que creemos en esa 
digitalización. 

■ Errores en los procesos de creación de la capa. Los procesos que realiza- 
mos para crear la capa pueden incorporar errores en el resultado. Por ejemplo, 
en el proceso de digitalización en base a ese mapa escaneado pueden aparecer 
errores por razones tales como un mal trabajo del operario, ya sea al digitalizar 
las entidades sobre una tableta o al teclear los valores de los atributos. Otros 
procesos, como pueden ser los de conversión entre los modelos ráster y vec- 
torial, también pueden tener como consecuencia la aparición de errores. Los 
capítulos 13 y 17 tratan estos procesos de conversión, y se verá en su momento 
los posibles errores que pueden aparecer en cada caso y las razones por las 
que lo hacen. Igualmente, se verá como aplicar a esos procesos los elementos 
de medida del error que se desarrollarán más adelante en este capítulo. 

■ Errores en los procesos de análisis. Un dato espacial puede derivar de un 
proceso de análisis, y en él pueden aparecer errores debidos principalmente 
a dos razones: o bien la capa original objeto de análisis contiene de por sí 
errores, o bien el proceso no es por completo correcto. Veremos en el capítulo 
15 cómo a partir de un MDE podemos calcular una capa con valores de 
pendiente, y cómo existen varios algoritmos distintos para realizar este cálculo. 
Ninguno de esos algoritmos es completamente preciso, y los valores calculados 
presentaran discrepancias de distinta magnitud con el valor real de pendiente, 
en función de diversos factores. Por su parte, el propio MDE también tiene sus 
propios errores, y estos se propagan a los resultados que derivamos de él, como 
veremos más adelante con detalle. En la parte de procesos veremos muchas 
operaciones que van a generar nuevos datos espaciales, y que pueden implicar 
la aparición de errores. Trataremos estos en su momento en la medida que 
ello pueda ser relevante para el manejo y utilización de esos datos derivados. 

7.4.1. Las componentes de la calidad 

La calidad de un dato espacial depende de muchos factores. Las características 
que dotan de dicha calidad al dato espacial son variadas, pues el dato espacial es 
en sí complejo, y cada una de estas características es susceptible de incorporar 
errores y por tanto de implicar una pérdida de calidad por ello. Las siguientes san 
algunos de los componentes principales de la calidad del dato espacial [96] : 

■ Exactitud posicional. Todo dato espacial tiene asociada una referencia 
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geográfica. La precisión con la que se toma esta condiciona la calidad del dato. 
Esta precisión puede considerarse únicamente en los ejes x e y, o también 
en el eje z (elevación). Esta última, no obstante, puede considerarse como 
un atributo si se trabaja en un SIG bidimensional, y tratarse de la misma 
forma que cualquier otra variable de similar índole sin significado espacial, 
tal como la temperatura en el punto (x,y) en cuestión. 

■ Exactitud en los atributos. Si la componente espacial puede tener erro- 
res, estos también pueden aparecer en la componente temática. Los valores 
asociados a una coordenada u objeto espacial pueden haber sido medidos 
con más o menos exactitud, o presentar valores incorrectos por muy diversas 
causas. Cuando el atributo en cuestión es de tipo categórico, puede existir un 
error de clasificación (se asocia la entidad espacial a una categoría errónea) , 
mientras que en el caso de atributos no categóricos pueden sencillamente 
aparecer valores mayores o menores que los reales. 

■ Consistencia lógica y coherencia topológica. Los datos espaciales no 
son elementos independientes, sino que existen relaciones entre ellos. Un 
dato de calidad debe recoger fielmente estas relaciones, siendo la topología 
la encargada de reflejar este tipo de información. Por ello, debe existir una 
coherencia topológica en el dato espacial. Además de la coherencia de las 
relaciones, existe una coherencia implícita en todo atributo o valor recogido, 
de forma que resulte lógico. Estos atributos y valores han de ser coherentes 
con las escalas de medida o el tipo de valor que se espera, entre otros. Así 
un valor de elevación no puede ser igual a «suelo calizo», ni un valor de 
temperatura expresado en Kelvin igual a -87. 

■ Compleción. El dato espacial no recoge todo lo que existe en una zona 
dada. Algunos elementos pueden no haberse recogido por cuestiones de escala 
(menores de un tamaño mínimo) , pero también pueden incluirse o excluirse 
en función de otros criterios, en especial para el caso de mapas temáticos. 
Estos criterios deben conocerse para saber por qué un dato espacial contiene 
una serie de valores o elementos y no otros. 

■ Calidad temporal. Aunque los datos espaciales son «imágenes» estáticas 
de la realidad, el tiempo es importante en muchos sentidos, pues afecta 
directamente a su calidad. La realidad que representa un dato geográfico 
es una realidad que varía con el paso del tiempo, y por tanto este paso del 
tiempo puede degradar la calidad del dato espacial en mayor o menor medida. 

■ Procedencia. Un dato espacial puede provenir de una fuente más o menos 
fiable, o haber sido generado a través de uno o varios procesos, en cada uno 
de los cuales se puede haber introducido algún tipo de error. Conocer la 
procedencia de un dato y los procesos que se han empleado en su confección 
es necesario para poder evaluar su calidad. 

Es importante recalcar que los errores que pueden incorporarse en estas compo- 
nentes de la calidad pueden ser tanto de tipo cuantitativo como de tipo cualitativo, 
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y que ello no está necesariamente ligado a la naturaleza de la componente o el 
tipo de variable a la que esta hace referencia. Así, un error en un atributo de tipo 
categórico supone un error cualitativo, pero un error posicional en la componente 
2 (o de atributo de tipo continuo, si lo consideramos como tal) también puede dar 
lugar a un error cualitativo, como se muestra en la figura 7.2. 



Figura 7.2: a) MDE con valores reales, b) y c) Dos MDE con errores posicionales en 
z. En el caso c), el error no solo es cualitativo, sino también cuantitativo, ya que modifica 
la forma del terreno, pasando de ser una depresión a ser un pico. 

En la figura, que representa una porción de un Modelo Digital de Elevaciones 
y dos variantes alternativas con sendos errores de medición de la elevación, en el 
primer caso, y pese a que el error es mayor (hay mayor discrepancia entre el valor 
real y el recogido en el MDE), no varía la configuración del terreno. En la celda 
central encontramos una depresión, ya que en ella la elevación es menor que en las 
circundantes, y esto sigue ocurriendo así a pesar de existir ese error posicional. En el 
segundo caso (subfigura c), sin embargo, el error es menor en magnitud, pero al ser 
de signo contrario hace que la depresión se convierta en un pico, una configuración 
del terreno exactamente inversa. Si estudiamos las formas del terreno en ese punto 
(un análisis que arroja resultados cualitativos), obtendremos un valor erróneo. 

Veremos más adelante que este tipo de errores son de gran importancia pa- 
ra muchos análisis, en particular para los relacionados con el comportamiento 
hidrológico del terreno, que estudiaremos en el capítulo 15. 

La forma en que los distintos tipos de errores aparecen en una capa es diferente 
en función del modelo de representación empleado, ya que cada uno de estos 
modelos tiene sus propias debilidades, y las fuentes de datos de las que pueden 
proceder son asimismo distintas. 

Así, los errores posicionales son más comunes en el caso de capas vectoriales, 
y una de las fuentes de error principal en este sentido son los procesos de digita- 
lización, especialmente si son de tipo manual. Junto a los errores de digitalización 
que vimos en el capítulo 6 (véase 6.5.5), existen otros que pueden aparecer al crear 
una capa vectorial, tales como los que se muestran en la figura 7.3 para el caso 
de digitalizar una línea. 

Con independencia de la pericia y experiencia de un operador, resulta imposible 
que sea capaz de reproducir exactamente el objeto original y trazar con el cursor de 
la tableta digitalizadora o el ratón todos los detalles de este con absoluta fidelidad. 
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Figura 7.3: Algunos errores que aparecen en la digitalización de lineas, a) Registro inexacto, 
b) puntos mal situados, c) desplazamientos por vértices insuficientes, d) errores de registro. 


Entre los errores que pueden aparecer encontramos falsos nudos (intersecciones 
de una línea consigo misma que no existen en realidad) , puntos situados fuera del 
objeto, coincidencia imperfecta entre polígonos o mala referenciación de la hoja 
al situarla sobre la tableta (en el proceso de registro) . 

El problema principal en el caso de digitalizar líneas o polígonos (que pueden 
causar la aparición de mayor número de errores por su mayor complejidad) estriba 
en que aquello que se digitaliza es un conjunto infinito de puntos, y el proceso 
de digitalización solo puede recoger un número finito de ellos y después unirlos 
mediante segmentos rectilíneos. 

La componente temática de una capa vectorial también puede adolecer de 
errores, que derivan a su vez tanto del proceso de introducción de los mismos como 
de los procesos de medición mediante los que se ha obtenido el valor concreto. 

En el caso de capas ráster, sin embargo, existen algunas fuentes de error que 
tienen menor importancia, mientras que otras sí han de tenerse en cuenta por su 
relevancia. Por ejemplo, la introducción de la componente temática en una capa 
vectorial puede hacerse manualmente con el teclado, mientras que en el caso de 
una capa ráster los valores de las celdas no se introducen manualmente. 

Ello no significa que las capas ráster no presenten errores en sus valores, pero 
el origen de estos es diferente. Un error habitual aparece en capas con información 
categórica que proceden de la clasificación de imágenes aéreas o de satélite. Los 
procesos que clasifican cada píxel de la imagen en función de sus Niveles Digitales 
(los cuales veremos en el capítulo 20) introducen frecuentemente errores, y aparecen 
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píxeles mal clasificados cuyo valor de clase no es correcto. 

Los errores posicionales se presentan de forma distinta a lo mostrado en la capa 
7.3. Las entidades tales como líneas van a tener una representación errónea debido 
a la resolución de la capa ráster, que no va a permitir registrar con fidelidad su 
forma real. Por otra parte, la georreferenciación de una imagen incorpora asimismo 
errores, que son equivalentes al error de registro en la digitalización vectorial. Este 
error va a ser distinto según las zonas de la imagen, ya que la distorsión que implica 
la transformación realizada no supone un error constante. Veremos estas funciones 
con más detalle también en el capítulo 16, donde se tratan los dos principales 
errores que afectan a las imágenes: errores geométricos y errores radiométricos 
(básicamente, errores posicionales y errores en los Niveles Digitales). 

Además de los errores de un único dato espacial (una capa de información) , 
es importante considerar la forma en que los errores de distintos datos interactúan 
entre sí. En el trabajo con SIG es raro emplear una única capa, y lo más frecuente 
es trabajar con varias de ellas coordinadamente, cada una con sus respectivos 
errores. El modo en que esos errores se afectan entre sí puede condicionar la calidad 
de los resultados de forma similar a como los propios errores como tales lo hacen. 

Como muestra la figura 7.4, dos errores sistemáticos de igual magnitud en sendas 
capas pueden tener efectos distintos sobre el resultado dependiendo de sus signos. 


a) 



b) 




Figura 7.4: Un error e pueden tener distintas consecuencias según interactúen con los erro- 
res deotros datos espaciales (e / ). En a) los errores casi se anulan, mientras que enb) se suman 
y dan lugar a un resultado erróneo. Los elementos en negro y gris indican la posición real. 

En la figura, tanto la capa de puntos como la de polígonos presentan un error 
sistemático. No obstante, un análisis que cuente el número de puntos dentro del 
polígono seguirá dando el mismo resultado en uno de los casos, ya que la forma 
de los errores de ambas capas hace que estos no afecten a este análisis, mientras 
que en el otro caso el resultado es completamente distinto del real. 


7.5. Detección y medición de errores 

Ahora que conocemos las fuentes y tipos de error, la evaluación y tratamiento 
de este empieza por su localización para saber a qué elementos del dato espacial 
afecta. Existen diversas metodologías para «inspeccionar» un dato espacial en 
busca de errores, que van desde métodos sencillos y obvios hasta avanzadas técnicas 
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con base estadística para detectar patrones particulares o elementos «sospechosos» 
de contener algún error. 

La forma más sencilla es la mera exploración visual. Algunos errores resultan 
obvios y una inspección sencilla permitirá localizarlos sin dificultad. Una coinci- 
dencia deficiente entre polígonos dejará un espacio en blanco que, si es de tamaño 
suficiente, puede ser localizado sencillamente en una exploración visual. De igual 
modo sucede con otro tipo de errores, en particular los errores de posición tales 
como los falsos nudos o la aparición de formas «ilógicas» (calles con ángulos muy 
bruscos, por ejemplo). 

Es importante en este sentido que la representación del dato espacial sobre 
la que se realiza la exploración visual sea clara y adecuada, para revelar de la 
forma más notoria posible las posibles deficiencias de este. En este libro se dedica 
una parte entera a la visualización y representación de la información espacial 
y, al contrario de lo que pueda pensarse, esta no es solo de importancia para la 
generación de resultados al final de un flujo de trabajo, sino desde su mismo inicio. 
El análisis visual de los datos de partida, así como otros procesos de análisis, 
pueden beneficiarse de una representación correcta. 

Existen errores que pueden detectarse visualmente, pero cuya detección (y 
corrección) puede automatizarse. Errores de este tipo son, por ejemplo, las cone- 
xiones imprecisas entre segmentos, que ya vimos en el capítulo 6. La función de 
snapping (ajuste por tolerancias), que se utiliza a la hora de digitalizar una capa 
vectorial, puede aplicarse a posterior i, una vez que la capa ya ha sido digitalizada. 
El SIG puede buscar esos enlaces imperfectos y convertirlos en enlaces correctos, 
resolviendo las uniones en las que exista una distancia entre vértices menor que 
una tolerancia preestablecida. 

Como sabemos, hay SIG que son capaces de manejar topología y otros que no. 
También hay formatos de archivo que pueden almacenar topología y otros que no 
están pensados para ello. Por esta razón, los SIG topológicos trabajan a menudo con 
datos sin topología, pero a partir de los cuales puede crearse esta, e implementan 
por ello las funciones para dicha creación de topología. Esta creación implica la 
corrección de errores topológicos que puedan existir en los datos originales, que no 
son relevantes en el caso de no trabajar con topología, y por ello pueden no haber 
sido detectados o eliminados. Errores como las antedichas falsas conexiones o los po- 
lígonos con adyacencia imperfecta, ambos se pueden corregir de forma automática, 
formando parte esas funciones de corrección de las rutinas de creación de topología. 

Otros errores no pueden detectarse visualmente, en muchos casos porque los 
motivos del error no se representan y no aparecen en la visualización. Errores 
topológicos relativos a las estructuras de datos empleadas para recoger dicha 
topología entran en este grupo. En muchos casos, pueden no obstante corregirse de 
forma automática a través de operaciones de filtrado y limpieza , que se encargan 
de controlar la coherencia topológica del dato. 

En el terreno de los atributos, la detección de errores puede llevarse a cabo 
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empleando las técnicas estadísticas habituales. La detección de valores improbables 
( outliers ) es uno de los procesos básicos. Estos outliers son observaciones dentro de 
un conjunto de datos que no parecen guardar consistencia con el resto del conjunto 
[99] y cuya detección puede llevarse a cabo de modo analítico o bien de modo 
visual, representando gráficamente los valores de los atributos. En general, las 
metodologías se fundamentan en comparar los valores con una distribución teórica 
y detectar la discordancia con esa distribución. Formas automatizadas de detectar 
outliers pueden encontrarse en [100]. 

Observaciones de este tipo, alejadas de las características generales del conjunto 
de datos, pueden derivar de medidas erróneas tales como las provocadas por un 
equipo de medición en mal estado, aunque también pueden representar valores 
correctos pero de carácter excepcional. 

Si se combina la componente espacial con la componente temática encontramos 
otro tipo de valores inusuales, los denominados outliers espaciales. Estos se definen 
como observaciones que son discordantes con las observaciones realizadas en su 
vecindad 1 [101]. 

La diferencia entre un outlier en la componente temática y un outlier espa- 
cial es clara. Así, un valor de 10000 metros en elevación constituye siempre un 
valor excepcional, ya que va a encontrarse lejos de los valores medios recogidos, 
independientemente del lugar donde se hayan efectuado las mediciones. Un valor 
de 5000 metros puede constituir un outlier espacial en unas zonas (si tomamos 
medidas de elevación en, por ejemplo, Madrid, ya que será muy distinto del resto de 
elevaciones), pero puede ser un valor perfectamente lógico en otras zonas de estudio. 

La detección de este tipo de valores puede realizarse, al igual que en el caso 
no espacial, de forma analítica o bien mediante exploración visual. 

En base a lo anterior, existen una serie de procedimientos y metodologías para 
la detección de valores ilógicos en un juego de datos, los cuales se dividen de forma 
más genérica en dos grupos principales: unidimensionales y multidimensionales. 
Cuando en los multidimensionales la vecindad se define únicamente en función de la 
localización espacial y sin utilizar la componente temática, se tiene la detección de 
outliers espaciales. La figura 7.5 muestra un esquema de esta clasificación y las me- 
todologías más habituales. En [102] puede encontrarse más información al respecto. 

Una vez localizado el error, este puede cuantificarse de diversas formas, según 
sea la naturaleza de la variable sobre la que se produce dicho error. 

Los errores posicionales o los atributos no categóricos son variables de tipo 
cuantitativo. El Error Medio Cuadrático es la forma más habitual de medir esos 
errores. Su expresión es: 


1 Este hecho tiene relación con el concepto de autocorrelación espacial, que veremos en detalle 
en el capítulo 10, y que expresa la idea lógica de que las mediciones cercanas deben tener valores 
similares 


196 


Sistemas de Información Geográfica 



Figura 7.5: Clasificación de métodos para la detección de observaciones inconsistentes 
(outliers) 


EMC 


N 


k N 


(7.5.1) 


donde N es el total de puntos en los que se comprueba el error, y el valor real, e y' el 
valor estimado. En esencia, se trata de una desviación típica, por lo cual se asume 
al emplear esta medida que los errores son aleatorios y se distribuyen normalmente. 

Otras medidas utilizadas son el Error Medio , el Error Medio Absoluto o el 
Error Máximo. 

Para valores cualitativos no puede aplicarse esta medida, y deben emplearse 
otros parámetros. La medida del número de valores que coinciden (elementos 
correctamente atribuidos) es una forma de determinar el error existente. El uso de 
la matriz de confusión es la forma más habitual de medir el error en la componente 
temática cuando esta es de tipo cualitativo. Veremos con más detalle su empleo 
y el de otras técnicas más complejas de similar propósito en el apartado 20.2.5. 


7.6. Propagación de errores y modelación del error 

El análisis de un dato espacial con errores va a dar un resultado que contiene a 
su vez errores, y existirá una relación directa entre los errores en el dato de partida 
y aquellos que aparecen en el dato resultante de su análisis. Este hecho se conoce 
como propagación de errores. 

La propagación de errores puede ser muy variable en función del tipo de error 
que aparezca y la clase de análisis que se lleve a cabo. Errores de gran magnitud en el 
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dato original pueden no tener apenas efecto en el resultado, mientras que pequeños 
errores pueden causar grandes alteraciones en la calidad del resultado [103]. 

Una de las áreas en las que más se ha trabajado en el estudio de la propagación 
de errores es el trabajo con Modelos Digitales de Elevaciones. Como veremos en el 
capítulo 15, los MDE son un dato de primer orden, ya que resultan de utilidad en 
prácticamente cualquier tipo de proyecto SIG, y son muy numerosos los distintos 
parámetros que podemos derivar de ellos. Por esta razón, la propagación de errores 
es un asunto importante dentro del trabajo con un MDE, pues de él se van a 
obtener muchos datos nuevos, e interesa saber cómo la calidad de estos nuevos 
datos se va a ver afectada por la calidad del MDE de partida. 

El error principal que se estudia en este tipo de análisis en un MDE es el 
de los atributos, es decir, el de la elevación. Los datos empleados se basan en el 
modelo de representación ráster, ya que este es el más habitualmente empleado 
para los análisis de un MDE. No obstante, metodologías como la que veremos a 
continuación pueden aplicarse igualmente para la modelación de otros errores, 
tales como los errores posicionales en la digitalización de una capa vectorial. 

La metodología más extendida para la modelación de errores es la basada en 
simulaciones de Monte Cario. El fundamento de este método es considerar un dato 
espacial dado (un MDE para el caso de este ejemplo) como una de las posibles 
«versiones» de la realidad que pueden existir con una magnitud de error concreta. 
Evaluando el error existente en un dato espacial y su distribución, y realizando 
simulaciones estocásticas en base a este, pueden obtenerse otras de esas «versiones» 
de la realidad. Posteriormente, puede realizarse el análisis no sobre el MDE con tal, 
sino sobre todo ese conjunto de datos derivados del MDE y su distribución de error. 

De este modo, se simula la presencia de error añadiendo ruido al MDE original, 
pero de una forma acorde con el propio error existente en el dato base. De las 
alternativas que se obtienen mediante estas simulaciones, ninguna de ellas tiene 
que ser necesariamente correcta y carente de errores [104] (lo más probable es que 
ninguna lo sea), pero el conjunto define un intervalo probable en el cual se situarán 
los valores reales. Se modela así la incertidumbre existente en el dato y la forma 
en que esta se propaga a los datos derivados. 

En el caso del MDE propuesto, y para una operación dada a aplicar sobre este, 
la forma de proceder puede resumirse en los siguientes pasos [98] : 

■ Estudiar la distribución del error en el MDE en base a un juego de datos de re- 
ferencia (generalmente un conjunto de puntos con mediciones precisas). Para 
modelizar el error no basta simplemente medir este con un parámetro como 
el error medio cuadrático, sino analizar su distribución y calcular parámetros 
estadísticos en base al conjunto de todos los errores medidos. Si se asume 
una distribución normal de los errores, la media y la desviación típica son 
necesarias para definir esa distribución. Al igual que sucede con los datos en sí, 
los errores presentan una dependencia espacial. Esto es, cerca de un valor que 
presenta un gran error, aparecerán otros también con errores notables, y cerca 
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de valores donde el error es pequeño, no existirán puntos muy erróneos. La au- 
tocorrelación espacial, que veremos con detalle más adelante en este libro, se 
presenta tanto en los datos como en los errores. Por esta razón, la modelación 
del error requerirá conocer otros elementos adicionales para definir correcta- 
mente su distribución, tales como semivariogramas o correlogramas (estudia- 
remos estos en detalle en el capítulo 12, dedicado a la estadística espacial). 

■ Utilizando la distribución de los errores se generan un número n de nuevos 
MDE. Para cada uno de ellos, se genera una capa aleatoria de errores que 
se ajusta a la distribución definida, y esta se suma al MDE original. De este 
modo, en lugar de una posible versión de la realidad, se tienen n versiones. 
La existencia de dependencia espacial puede añadirse en este paso si no se 
considera en el anterior, mediante el procesado de las capas de error y la 
aplicación de filtros sobre estas. 

■ Se aplica la operación sobre cada una de las n capas obtenidas. 

■ Se calculan parámetros estadísticos de los n resultados obtenidos, a partir 
de los cuales puede crearse un resultado único. Por ejemplo, la media de 
los n resultados obtenidos puede considerarse como valor resultante de la 
operación, en sustitución del que se obtendría aplicando esta únicamente 
al MDE original. 

En la figura 7.6 se muestra un esquema gráfico de esta metodología. 



Figura 7.6: Esquema de la modelación de errores mediante simulaciones de Monte Cario 

Para ver con más claridad el efecto de este proceso, la figura 7.7 muestra 
respectivamente los resultados obtenidos a partir de un MDE, y la media de 20 
y 50 simulaciones obtenidas según lo explicado anteriormente para el calculo de 
la curvatura horizontal (esté parámetro se explica en el capítulo 15). 

Pese a su importancia, las herramientas para estos análisis no se implementan 
de forma habitual en los SIG, sino que deben llevarse a cabo utilizando funciona- 
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Figura 7.7: De izquierda a derecha, curvatura horizontal obtenida a partir del MDE 
original o como media de 20 y 50 simulaciones de Monte Cario (tomado de [103]) 


lidades individuales de análisis y programando los procesos repetitivos que son 
necesarios para calcular todas las capas derivadas empleadas. Por esta razón, es 
extraño que estos procesos se lleven a cabo en proyectos SIG de modo genérico. 
El usuario de SIG es consciente de los errores que presentan los datos espaciales 
con los que trabaja y las implicaciones de estos en lo que respecta a la calidad de 
datos, pero raramente desarrolla procesos de modelación de la incertidumbre, que 
quedan por el momento reservados para un ámbito más teórico que práctico. 


7.7. Gestión de errores 

Conocidos los tipos de errores fundamentales que encontramos en los datos 
espaciales y la manera de medir estos y su propagación, deben formularse estra- 
tegias para tratar de reducir el error y definir metodologías que permitan obtener 
resultados más precisos dentro de un proyecto SIG. 

Estas estrategias dependen, como es lógico, del tipo de proyecto, sus objetivos, 
o el tipo de dato que se emplee para su desarrollo, pues estos factores van a 
condicionar directamente el tipo de errores que aparecen, y por tanto también la 
forma de controlar estos. 

Podemos dividir estas estrategias en dos grupos fundamentales: 

■ Utilización de datos de partida más precisos. Deben establecerse parámetros 
de calidad referidos a los datos con los que se trabaja, que permitan tener 
garantía de que estos están en condiciones de dar respuestas correctas a las 
cuestiones que planteemos en base a ellos. 

■ Minimización de los errores a lo largo del desarrollo del trabajo. No todas las 
operaciones que realizamos en un SIG implican la introducción de errores 
en la misma medida. La propagación del error puede controlarse si estructu- 
ramos adecuadamente los pasos a realizar, situando al final de la cadena de 
procesos aquellos que sean más propensos a generar errores o sobre los que se 
tenga más incertidumbre en cuanto a la calidad de los resultados que arrojan. 

Con independencia de la forma en que la gestión de errores se aborde, es 
importante que a la hora de trabajar con un SIG se tengan en cuenta ciertas 
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ideas fundamentales con objeto de evitar la introducción de errores innecesarios. 
Algunas de estas ideas se enumeran seguidamente: 

■ La utilización de capas de distintos orígenes y en distintos formatos favorece 
la aparición de errores y puede dar lugar a resultados de precisión insuficiente 
[105], 

■ La precisión disminuye a medida que lo hace la resolución espacial [106] . 

■ La precisión de un resultado nunca sera superior a la del dato de entrada 
con peor precisión [107]. 

■ Cuanto mayor es el número de capas empleadas para un análisis, mayores 
oportunidades existen de incorporar error a este e imprecisión a los resultados 
[107], 

Es igualmente importante recalcar el hecho de que los datos digitales con los 
que trabajamos en un SIG no son per se mejores que los datos analógicos en cuanto 
a su precisión y su falta de errores. Si bien existen muchas ventajas asociadas 
a los datos digitales, tal y como vimos en el capítulo 6, la precisión no ha de 
ser necesariamente una de ellas, o al menos no como para poder asumir que su 
naturaleza digital implica que un dato es de calidad suficiente. En ocasiones, los 
usuarios de SIG pueden olvidar esto y trabajar bajo unas suposiciones incorrectas, 
introduciendo errores en sus resultados y no siendo conscientes de ello. 

La importancia de los metadatos es grande en este sentido, ya que la cartografía 
impresa habitualmente contiene información acerca de su calidad y su precisión, 
pero al trabajar con una capa en un SIG, esa información la contienen los metadatos. 
Mientras que en un mapa impreso no podemos separar el mapa en sí de esa informa- 
ción, en el contexto de capas de un SIG estas se encuentran formalmente separadas, 
hasta tal punto que la práctica más habitual es trabajar con capas sin metadatos 
o, de existir estos, no emplearse como parte importante de los propios datos. 


7.8. Resumen 

Pese a no haber sido una preocupación importante en los comienzos de los 
SIG, la calidad de los datos geográficos es hoy en día un aspecto clave para el 
trabajo con SIG. Las etapas fundamentales relativas a la calidad de los datos son 
la identificación de la fuente de error, su detección y medición, su modelación y, 
por último, la gestión de dicho error. 

Las fuentes de error principales son las deficiencias de los datos originales, los 
errores conceptuales, los derivados de los procesos de digitalización y los introduci- 
dos en la realización de procesos con los datos. Estas fuentes introducen errores de 
posicionamiento, errores en los atributos asociados o de coherencia topológica, entre 
otros. Estas son algunas de las denominadas componentes de la calidad, entre las que 
también encontramos la procedencia de los datos o la validez temporal de los datos. 


Los errores aparecen de forma distinta en función de las características de los 
datos, en particular del modelo de representación elegido. 

Detectar los errores puede realizarse de forma visual o bien de forma analítica, 
pudiendo automatizarse en este segundo caso. El error medio cuadrático es la 
medida más habitual del error en el caso de variables cuantitativas, mientras que 
la matriz de confusión es empleada para variables cualitativas. 

Modelar el error y su propagación puede emplearse para conocer de forma más 
adecuada la validez de los resultados obtenidos a partir de un dato espacial. La 
realización de simulaciones condicionales mediante el método de Monte Cario es 
la técnica más habitual para la modelación de errores. 

Por último, es importante ser consciente de los errores que contienen los datos 
y de la posible aparición de estos a medida que realizamos tareas con ellos, con 
objeto de minimizar dicha aparición y limitar la presencia e influencia de los errores 
en los resultados finales. 
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Capítulo 8 


Bases de datos 


Los sistemas gestores de bases de datos son la herramienta más adecuada para alma- 
cenar los datos en un sistema de información debido a sus características de seguridad , 
recuperación ante fallos, gestión centralizada , estandarización del lenguaje de consulta 
y funcionalidad avanzada. En este capítulo analizaremos algunas ideas acerca de estos 
importantes componentes de los SIG en la actualidad y veremos las principales alternativas 
existentes, al tiempo que estudiaremos los fundamentos de bases de datos necesarios para 
comprender la forma en que los datos espaciales se almacenan en las bases de datos actuales. 
Asimismo, y para entender la situación presente y conocer las ventajas e inconvenientes 
de los distintos métodos de almacenar la información en los SIG, veremos la evolución 
de estos respecto a la arquitectura de almacenamiento de información. 


8.1. Introducción 

Las bases de datos son un elemento fundamental en el entorno informático hoy 
en día y tienen aplicación en la práctica totalidad de campos. Concebidas con un 
propósito general, son de utilidad para toda disciplina o área de aplicación en la 
que exista una necesidad de gestionar datos, tanto más cuanto más voluminosos 
sean estos. En nuestro ámbito particular de los SIG, los datos son cada día más 
voluminosos, debido no solo a una mayor cantidad de información, sino también 
a una mayor precisión en esta, la cual implica un mayor volumen de datos. Ade- 
más, presentan otra serie de características (uso múltiple, necesidad de acceso 
eficiente para análisis, necesidad de indexación, etc.), haciendo todas ellas que sea 
recomendable el uso de bases de datos y tecnologías específicas para su manejo. 

Pese a que, como veremos en este mismo capítulo, el uso de las bases de datos en 
el ámbito SIG no ha sido siempre el actual, hoy en día representan una parte clave 
para la gestión de los datos geográficos, en especial dentro del marco de proyectos de 
cierta envergadura. Aunque la realidad es que todavía se efectúa mucho trabajo SIG 
sin emplear bases de datos (y las aplicaciones SIG así lo permiten, no siendo estric- 
tamente necesario disponer de una base de datos para almacenar la información) , 
la naturaleza propia de los proyectos SIG y la progresiva implantación de los SIG a 
niveles más allá del uso personal (por ejemplo, SIG corporativos o Infraestructuras 
de Datos Espaciales, acerca de las cuales se hablará en la parte VI dedicada al 
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factor organizativo) traen ambas consigo un uso cada vez mayor de las bases de 
datos, y por tanto una mayor necesidad de conocer el funcionamiento de estas. 


8.2. Fundamentos de bases de datos 

Aunque las particularidades de los datos espaciales con los que trabajamos en 
un SIG han hecho necesarias modificaciones y adaptaciones sobre el esquema de 
trabajo de las bases de datos genéricas, en esencia los fundamentos de estas siguen 
constituyendo el elemento primordial sobre el que la arquitectura de gestión de da- 
tos espaciales se apoya, y es necesario conocerlos con cierto detalle. En esta sección, 
veremos de forma introductoria esos fundamentos de bases de datos genéricas, 
aplicables a cualquier otro ámbito además del de los SIG, para posteriormente 
poder tratar el caso particular de los datos espaciales. Para el lector interesado en 
profundizar en el tema, una referencia libre y en español con información extensa 
y detallada sobre bases de datos genéricas es [108]. 

8.2.1. ¿Qué es una base de datos? 

Entendemos como Base de Datos un conjunto de datos estructurado y almace- 
nado de forma sistemática con objeto de facilitar su posterior utilización. Una base 
de datos puede, por tanto, constituirse con cualquier tipo de datos, incluyendo 
los de tipo puramente espacial (geometrías, etc.) tales como los que se utilizan en 
un SIG, así como, por supuesto, datos numéricos y alfanuméricos como los que 
constituyen la componente temática de la información geoespacial. Los elementos 
clave de la base de datos son esa estructuración y sistematicidad, pues ambas son 
las responsables de las características que hacen de la base de datos un enfoque 
superior a la hora de gestionar datos. 

Podemos ver más claramente las implicaciones de utilizar una base de datos 
si recurrimos al ejemplo que vimos en el primer capítulo de este libro, relativo 
a la gestión forestal de un territorio. Para ello, consideremos que el número de 
usuarios del SIG y de los datos asociados no se limita únicamente al gestor forestal 
que ha de tomar decisiones o establecer planes de actuación, sino a muchos otros 
profesionales que puedan ejercer su trabajo en ese mismo área o puedan emplear 
total o parcialmente esos mismos datos. 

Imaginemos, por ejemplo, el caso de un ingeniero encargado de planear la insta- 
lación de un tendido eléctrico a través de nuestra zona forestal de ejemplo. Sin duda, 
deberá emplear datos tales como Modelos Digitales de Elevaciones, capas de zonas 
protegidas o capas de arbolado para establecer el trazado óptimo y estimar costes 
de la línea, entre otras tareas. Si en una situación ideal este ingeniero estaría en 
comunicación con el gestor forestal y ambos compartirían sus conocimientos dentro 
de un equipo multidisciplinar, también en lo referente a los datos debería existir una 


Bases de datos 


205 


comunicación igual que implique, ente otras cosas, un uso compartido y conveniente- 
mente coordinado de ellos. En otras palabras, los datos también tienen ese carácter 
multidisciplinar y deben dejar de verse como algo propio de un uso particular, para 
concebirse como un conjunto global del que se benefician muy diversos usuarios. 

Establecer un uso compartido de los datos en una situación como la anterior 
no parece difícil, ya que simplemente se trata de dos profesionales que realizan 
tareas relacionadas y que, de un modo u otro, van a tener un contacto directo. El 
gestor forestal puede sencillamente dar una copia de sus datos al ingeniero y este 
podrá trabajar después con ellos de forma independiente. Aunque los datos con 
que trabajen son inicialmente los mismos, en realidad esta práctica da lugar son 
dos copias aisladas que constituyen dos universos distintos. 

La situación real, sin embargo, es habitualmente mucho más compleja, y utilizar 
un esquema de colaboración como el anterior puede ser imposible, carecer por 
completo de sentido, o tener un buen número de consecuencias negativas. A medida 
que aumenta el número de usuarios, resulta menos recomendable que cada uno 
trabaje con sus propios datos y se los hagan llegar entre ellos a medida que los 
necesitan (una realidad que, desgraciadamente, se presenta con más frecuencia 
de lo recomendable). No debe olvidarse que un conjunto más amplio de usuarios 
que trabajan de esta forma y son ellos mismos quienes gestionan sus propios datos, 
implica directamente un número también más elevado de aplicaciones informáticas 
y de formatos de archivo, complicando enormemente el trabajo coordinado en 
cuanto el equipo tiene un tamaño medio. 

Es probable además que existan usuarios dentro de una misma organización 
(por ejemplo, un organismo público) que aunque requieran para su trabajo datos 
similares, no tengan contacto alguno entre sí. Aunque los usuarios sean indepen- 
dientes, sus datos no lo han de ser necesariamente, y en una situación ideal deberían 
acudir a un repositorio único de datos del que cada cual tomaría lo necesario, en 
lugar de basar su trabajo en un conjunto de datos fragmentado y difícil de gestionar. 

Pensemos en un dato que pueda ser de interés a varios usuarios, como por 
ejemplo una capa de vías de comunicación. A nuestro gestor forestal le será de 
interés para, por ejemplo, saber qué medios de acceso existen en caso de tener 
que hacer frente a un incendio. Lo más relevante de esas vías será su trazado, es 
decir su geometría, y tal vez el tipo de vía de que se trata, para poder conocer la 
velocidad a la que se pueden desplazar los medios de extinción. Otros usuarios, por 
su parte, pueden necesitar parámetros distintos como el volumen de tráfico medio 
de cada vía. Si todos ellos tienen una capa de vías con los parámetros asociados 
que necesitan para su trabajo, nos encontramos con una innecesaria redundancia 
de la componente espacial (las geometrías) , y una dispersión de la componente 
temática, que resultaría más conveniente mantenerla agrupada. 

Pensemos ahora que el gestor forestal detecta un error en el trazado de una de las 
vías y lo corrige. Esa corrección no estará disponible para los restantes usuarios, que 
pueden a su vez efectuar modificaciones similares que no redundarán en una mayor 
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calidad de los datos con los que trabaja el gestor forestal, ya que, pese a utilizar datos 
similares, trabaja con su propio conjunto de datos. Incluso si en algún momento to- 
dos estos usuarios deciden poner en común sus datos y unirlos, esta operación puede 
ser muy compleja o incluso, como sucede frecuentemente, imposible de realizar. Por 
su parte, otros usuarios pueden añadir una nueva variable temática, como por ejem- 
plo un índice de siniestralidad de la vía, el cual, si bien tal vez no resulte de utilidad 
inmediata para muchos usuarios, en un futuro sí pudiera serlo. Una vez más, estos 
nuevos datos no quedan a disposición del resto de usuarios, y en caso de serlo, no lo 
hacen en conjunto con datos similares, sino como un dato aislado de los restantes. 

En definitiva, es complejo gestionar de forma adecuada los datos en el momento 
en que estos alcanzan un ámbito más allá de lo personal, y las prácticas más 
habituales basadas en una gestión «manual» de un conjunto de ficheros no son 
una opción adecuada. La solución para lograr esa necesaria gestión centralizada 
de los datos son las bases de datos y también, como veremos más adelante, los 
sistemas gestores de bases de datos, que representan la interfaz entre las bases de 
datos y los distintos usuarios. 

8.2.2. ¿Por qué interesa usar una base de datos? 

En base al ejemplo anterior, podemos analizar algo más sistemáticamente las 
ventajas de una base de datos frente a una gestión no organizada de los datos. 
Las ventajas de utilizar un almacenamiento estructurado se aprecian en diversos 
puntos, ya que afectan no solo a los datos sino también al propio uso que se hace 
de estos. Algunas ventajas que afectan directamente a los datos son las siguientes: 

■ Mayor independencia. Los datos son independientes de las aplicaciones 
que los usan, así como de los usuarios. 

■ Mayor disponibilidad. Se facilita el acceso a los datos desde contextos, 
aplicaciones y medios distintos, haciéndolos útiles para un mayor número 
de usuarios. 

■ Mayor seguridad (protección de los datos). Por ejemplo, resulta más 
fácil replicar una base de datos para mantener una copia de seguridad que 
hacerlo con un conjunto de ficheros almacenados de forma no estructurada. 
Además, al estar centralizado el acceso a los datos, existe una verdadera 
sincronización de todo el trabajo que se haya podido hacer sobre estos 
(modificaciones) , con lo que esa copia de seguridad servirá a todos los usuarios. 

■ Menor redundancia. Un mismo dato no se encuentra almacenado en 
múltiples ficheros o con múltiples esquemas distintos, sino en una única 
instancia en la base de datos. Esto redunda en menor volumen de datos y 
mayor rapidez de acceso. 

■ Mayor eficiencia en la captura, codificación y entrada de datos. 

Esto tiene una consecuencia directa sobre los resultados que se obtienen de la ex- 
plotación de la base de datos, presentándose al respecto ventajas como, por ejemplo: 
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■ Mayor coherencia. La mayor calidad de los datos que se deriva de su mejor 
gestión deriva en mayor calidad de los resultados. 

■ Mayor eficiencia. Facilitando el acceso a los datos y haciendo más sencilla 
su explotación, la obtención de resultados es más eficiente. 

■ Mayor valor informativo. Resulta más sencillo extraer la información 
que los datos contienen, ya que uno de los cometidos de la base de datos es 
aumentar el valor de estos como fuente de información. 

Por último, los usuarios de la base de datos también obtienen ventajas al 
trabajar con estas, entre los que cabe citar: 

■ Mayor facilidad y sencillez de acceso. El usuario de la base de datos se 
debe preocupar únicamente de usar los datos, disponiendo para ello de las 
herramientas adecuadas y de una estructura solida sobre la que apoyarse. 

■ Facilidad para reutilización de datos. Esto es, facilidad para compartir. 

De forma resumida, puede decirse que la principal bondad de una base de datos 

es la centralización que supone de todos los datos con los que se trabaja en un 
contexto determinado, con las consecuencias que ello tiene para una mejor gestión, 
acceso o estructuración de estos. 


8.2.3. Modelos de bases de datos 

En función de la estructura utilizada para construir una base de datos, existen di- 
versos modelos de bases de datos. El modelo de la base de datos define un paradigma 
de almacenamiento, estableciendo cómo se estructuran los datos y las relaciones en- 
tre estos. Las distintas operaciones sobre la base de datos (eliminación o sustitución 
de datos, lectura de datos, etc.) vienen condicionadas por esta estructura, y existen 
notables diferencias entre los principales modelos, cada uno de ellos con sus ventajas 
e inconvenientes particulares. Algunos de los más habituales son los siguientes: 

■ Bases de datos jerárquicas. Los datos se recogen mediante una estructura 
basada en nodos interconectados. Cada nodo puede tener un único padre 
y cero, uno o varios hijos. De este modo, se crea una estructura en forma 
de árbol invertido en el que todos sus nodos dependen en última instancia 
de uno denominado raíz. Aunque potente, el modelo jerárquico presenta 
algunas deficiencias, principalmente la escasa independencia de sus registros 
(el acceso a un registro — un nodo — implica que se ha de pasar por sus padres, 
restando flexibilidad a la navegación por la base de datos). Otra grave defi- 
ciencia de este modelo es la mala gestión de la redundancia de datos, ya que 
si un registro guarda relación con dos o más, debe almacenarse varias veces, 
ya que no se permite que el nodo correspondiente tenga varios padres. Esto 
tiene consecuencias no solo en el mayor volumen de datos que se almacena, 
sino también en la integridad y coherencia de los datos. Si se modifica una de 
las «copias» de ese registro en la base de datos, deben modificarse también las 
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restantes, ya que, aunque no conectadas en la estructura de la base de datos, 
realmente representan una única realidad y debieran ser idénticas entre sí. 

■ Bases de datos en red. Con objeto de solucionar los problemas de redun- 
dancia de las bases de datos jerárquicas, surge el modelo en red. Este modelo 
permite la aparición de ciclos en la estructura de la base de datos (es decir, 
no ha de existir un único padre para cada nodo), lo cual permite una mayor 
eficacia en lo que a la redundancia de datos se refiere. Presenta, no obstante, 
otros problemas, siendo el más importante de ellos su gran complejidad, lo 
que hace difícil la administración de la base de datos. 

■ Bases de datos relaciónales. Constituyen el modelo de bases de datos 
más utilizado en la actualidad. Solucionan los problemas asociados a las 
bases de datos jerárquicas y en red, utilizando para ello un esquema basado 
en tablas, que resulta a la vez sencillo de comprender y fácil de utilizar para 
el análisis y la consulta de los datos. Las tablas contienen un número dado de 
registros (equivalentes a las filas en la tabla) , así como campos (columnas) , 
lo que da lugar a una correcta estructuración y un acceso eficiente. 

■ Bases de datos orientadas a objetos. Se trata de uno de los modelos 
más actuales, derivado directamente de los paradigmas de la programación 
orientada a objetos. El modelo extiende las capacidades de las bases de datos 
relaciónales, de tal modo que estas pueden contener objetos, permitiendo 
así una integración más fácil con la propia arquitectura de los programas 
empleados para el manejo de la base de datos, en caso de que estos hayan sido 
desarrollados mediante programación orientada a objetos. Su popularidad 
crece de forma notable en ciertas áreas en las cuales resultan más ventajosas 
que el modelo relacional, siendo los SIG una de ellas. 

La figura 8.1 muestra una comparación esquemática de los anteriores modelos 
de bases de datos. 

8.2.4. Bases de datos relaciónales 

Aunque, como ya hemos visto, existen diversos tipos de bases de datos, las más 
utilizadas con diferencia en la actualidad son las relaciónales, que han demostrado 
su idoneidad en la mayor parte de situaciones. Estas son también las que encon- 
traremos en el ámbito SIG, y resulta por ello necesario añadir algunas nociones 
adicionales sobre ellas para la correcta comprensión no solo de este capítulo, sino 
también de otros posteriores que desarrollan temas relacionados. 

El modelo relacional fue desarrollado en 1969 por Ted Codd y publicado un año 
después en un artículo ya clásico [110], y consiste básicamente en un conjunto de re- 
laciones tabulares. Estas relaciones son tan importantes como los propios datos (las 
tablas, en este caso) , y constituyen una idea central en el modelo relacional, de ahí su 
denominación. La característica principales que ha convertido a este modelo de base 
de datos en el más popular en la actualidad es su gran simplicidad, la cual indirecta- 
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Red 


Relacional 




Jerárquico 


Orientado a objetos 



Actividad 

Ruta 

Producción diaria 
Horas equipamiento 
Horas labor 

Objecto 1 : Informe de mantenimiento 


1 01/12/01 
24 
1-95 
2.5 
6 

6 | 
Instancia del objeto 1 


Nombre actividad 
Unidad de producción 


Producción diaria media 


Objeto 2: Actividad de mantenimiento 


Figura 8.1: Comparación entre algunos modelos de base de datos más frecuentes 
(adaptado de [109]). 


mente le dota de una gran potencia. Paralelamente, el modelo relacional se sustenta 
en unos fundamentos matemáticos sólidos y sus ideas pueden expresarse mediante 
conceptos de la teoría de conjuntos, lo que posibilita un análisis formal del mismo. 

Además de las denominaciones habituales de tabla , fila y columna , existe una 
terminología específica empleada al referirse a las bases de datos relaciónales. Así, 
en el modelo relacional los datos se organizan en tablas bidimensionales, cada 
una de ellas con información relativa a un determinada entidad. La tabla en sí se 
conoce como relación , ya que recoge la relación existente entre sus elementos, y 
constituye así el eje central del modelo relacional. Dentro de la tabla, los datos están 
organizados a su vez en filas y columnas. Las columnas representan los distintos 
atributos asociados a la entidad, mientras que las filas conforman los distintos 
registros. Una fila se forma con un conjunto de n atributos, constituyendo una tupia. 

El esquema de la relación está formado por los nombres de los atributos y un do- 
minio asociado a estos, que delimita el rango de valores posibles para cada atributo. 
El dominio especifica el tipo de dato a contener en cada columna. Por ejemplo, si se 
recoge un nombre el atributo será de tipo alfanumérico, mientras que si el atributo 
es un conteo deberá ser de tipo entero. Además de los tipos habituales (fechas, cade- 
nas de texto, valores reales 1 , valores enteros, etc.) pueden emplearse en ciertas bases 

1 Entiéndase el adjetivo real aquí en su sentido matemático, es decir, un número n tal que 
n £ R. Puede emplearse también la denominación menos formal de número decimal o bien 
valor de coma flotante, esta última más común en el ámbito informático y referida a la forma 
de almacenamiento de este tipo de valores. 


210 


Sistemas de Información Geográfica 


de datos valores más complejos. Esto es de especial interés en el caso de los SIG, ya 
que permite utilizar geometrías como un tipo de datos más, con la utilidad que esto 
tiene a la hora de almacenar datos espaciales. El esquema de la relación se recoge 
en la primera fila de la tabla, conocida como cabecera. El número de filas de la tabla 
sin contar la cabecera (es decir, el número de tupias) se conoce como cardinalidad. 

Las relaciones son, por tanto, un conjunto de tupias asociadas a un esquema. En 
una relación, tanto el orden de las filas como el de las columnas son irrelevantes (ex- 
ceptuando la cabecera, que no es un tupia como tal, sino que define el esquema como 
hemos visto) , pero es importante que cada atributo sea del tipo correspondiente 
a la columna a la que pertenece. Es decir, que sea coherente con el esquema. 

El cuadro 8.1 muestra un resumen de algunas de las equivalencias entre la 
terminología habitual y la específica del modelo relacional. En la figura 8.2 puede 
verse un esquema de los elementos fundamentales del modelo relacional. 


Terminología habitual 

Modelo relacional 

Tabla 

Relación 

Fila 

Tupia 

Columna 

Atributo 

Número de filas 

Cardinalidad 

Valores posibles 

Dominio 

Identificador único 

Clave primaria 


Cuadro 8.1: Terminología del modelo relacional (Adaptado de [111]). 


Relación 

(tabla) 


Atributo (columna) 



Cabecera 
Tupia (fila) 


Una forma abreviada de definir las relaciones que forman parte de una base de 
datos es mediante su nombre y su esquema expresado como una lista de los atri- 
butos que lo constituyen. Por ejemplo, podemos definir una relación denominada 
PERSONAS como 


PERSONAS (DNI , Nombre, Altura, Edad, Ciudad) 
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Una base de datos contiene normalmente más de una tabla, ya que suelen ser 
muchos los tipos de datos a almacenar y resulta conveniente dividirlos en distintas 
tablas. Además de las relaciones que la tabla en sí implica, es necesario definir relacio- 
nes entre las distintas tablas, y para ello se emplean los denominados atributos clave. 
Un atributo clave es aquel que tiene valor único para cada tupia, pudiendo servir pa- 
ra representar a esta plenamente. Por ejemplo, en una tabla con nombres de personas 
e información adicional sobre ellas según el esquema anterior, los nombres no pueden 
ser la clave primaria, ya que puede haber dos personas con un mismo nombre. El nú- 
mero de su Documento Nacional de Identidad, sin embargo, sí que puede servir como 
atributo clave. Además de su unicidad, una clave debe ser invariable, identificando 
la misma tupia a lo largo del tiempo. Un esquema de relación puede contener varios 
atributos clave, que se conocen como claves candidatas. Normalmente, de estas se eli- 
ge una como representante principal de las tupias, y se conoce como clave primaria 

Por convención, las claves se escriben subrayadas al definir el esquema de la 
tabla, de tal modo que el de la tabla PERSONAS quedaría de la siguiente forma: 

PERSONAS ( DNI , Nombre, Altura, Edad, Ciudad) 

Si no existe ningún atributo que cumpla los requisitos para ser utilizado como 
clave, este puede incorporarse al esquema de la relación, añadiendo por ejemplo un 
nuevo atributo con un código arbitrario. Un ejemplo de esto lo podemos encontrar 
en el cuadro 8.2, donde se incorpora un atributo que hace la función de clave a una 
tabla con información sobre personas pero que no contiene el DNI de estas entre 
esa información y, por tanto, carece de un atributo adecuado para servir de clave. 

En la definición de clave cabe también la presencia de claves compuestas, es 
decir, formadas por varios atributos cuya combinación es única para cada tupia. No 
obstante, la utilización de claves simples es preferible generalmente, ya que simpli- 
fica gran parte de las operaciones en las que la presencia de una clave es necesaria. 

Cuando trabajamos con datos espaciales, es habitual emplear la componente 
espacial como clave, ya que esta suele ser única. En el caso de almacenar informa- 
ción sobre ciudades, con los nombres sucede de forma similar a lo visto para el caso 
de personas, ya que existen ciudades con el mismo nombre en distintos lugares. La 
localización de estas, sin embargo, es única, ya que no puede haber dos ciudades 
simultáneamente en el mismo lugar. 

El empleo de estas claves permite relacionar tablas entre sí, siempre que estas 
compartan algún atributo común. Por ejemplo, pensemos en una base de datos 
que contenga la tabla anterior y junto a esta la tabla mostrada en el cuadro 8.3. 
Es decir, la base de datos contiene información sobre personas y sobre ciudades. 

Es sencillo ver que puede vincularse una tabla a la otra a través del atributo que 
contiene el nombre de la ciudad. Nótese que este atributo no tiene el mismo nombre 
en ambas tablas, y que, mientras que en una de ellas representa la clave primaria 2 , 

2 Pese a que se ha comentado que el nombre de la ciudad puede no ser adecuado como clave, en 
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a) 


DNI 

Nombre 

Altura 

Edad 

Ciudad 

50234561 

Juan Gómez 

1,85 

35 

Madrid 

13254673 

Edurne Montero 

1,60 

30 

Toledo 

46576290 

Luis Urrutia 

1,75 

46 

Madrid 

38941882 

Juan Gómez 

1,71 

55 

Valencia 


b) 


ID 

Nombre 

Altura 

Edad 

Ciudad 

001 

Juan Gómez 

1,85 

35 

Madrid 

002 

Edurne Montero 

1,60 

30 

Toledo 

003 

Luis Urrutia 

1,75 

46 

Madrid 

004 

Juan Gómez 

1,71 

55 

Valencia 


Cuadro 8.2: Adición de un campo para crear una clave. La tabla a) contiene un atributo 
único (DNI). La tabla b) no contiene un atributo único entre sus datos, pero se añade el 
campo ID con un código arbitrario que puede ser empleado como clave. El nombre en este 
caso no sirve como atributo único, ya que hay dos personas en la tabla con el mismo nombre. 


Nombre 

Habitantes 

Superficie(fcm * 2 ) 

Madrid 

6386932 

607 

Valencia 

1564145 

134 

Toledo 

80810 

232 


Cuadro 8.3: Tabla CIUDADES 


en la otra no puede serlo pues existen nombres de ciudades repetidos. Pese a ello, 
este atributo nos permite establecer una relación entre las tablas 3 , que podríamos 
denominar «nacido en». A cada tupia de la primera tabla, que representa a una 
persona dada, podemos vincularla con una de la segunda tabla, que representa 


este caso sí puede serlo debido a las pocas filas que contiene la tabla, por lo que, en aras de la simpli- 

cidad, lo utilizaremos asumiendo que no van a existir en la tabla dos ciudades con el mismo nombre. 

3 Nótese que estamos empleando aquí el término relación para referirnos al vínculo entre 
tablas, pero que este término también se emplea para referirse a las propias tablas, lo cual puede 
dar lugar a confusiones. Para evitarlo, emplearemos el término tabla para referirnos a estas, y 
mediante los términos relación o interrelación haremos a partir de ahora únicamente referencia 
a esos vínculos que permiten enlazar varias de dichas tablas. 
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una ciudad en particular, ya que toda persona ha nacido en una ciudad y gracias 
al atributo CIUDAD podemos saber exactamente cuál es dicha ciudad. 

Las interrelaciones entre tablas pueden ser de distintos tipos en función del nú- 
mero de elementos distintos que se vinculan de cada tabla. En nuestra relación «vive 
en» , una persona puede vivir en una única ciudad, mientras que una ciudad puede te- 
ner muchas personas viviendo en ella. Es decir, cada tupia de la tabla PERSONAS se re- 
laciona con una única de la tabla CIUDADES, y cada tupia de esta última se relaciona 
con una o varias de la primera. Este tipo de relación se conoce como de uno a muchos. 

Existen otros dos tipos de relaciones además de esta: las denominadas de uno 
a uno y las de muchos a muchos. Un ejemplo de relación de uno a uno podrían 
ser «casado con», que estableceríamos entre la tabla PERSONAS y ella misma (las 
dos tablas implicadas no han de ser necesariamente distintas). Cada persona 
puede estar casada únicamente con otra, por lo que la relación es de uno con uno, 
relacionándose una tupia con tan solo otra distinta, y no con varias. 

Es importante reseñar que en algunas relaciones como «nacido en» todos los 
elementos de una o de las dos tablas se encuentran vinculados de algún modo a través 
de la relación, mientras que en otros no es así necesariamente. Así, todas las personas 
han nacido en alguna ciudad, y estarán relacionadas con la correspondiente tupia 
en la tabla CIUDADES, pero no todas las personas están necesariamente casadas. 

Un ejemplo de relación muchos a muchos la podemos plantear si contamos 
en nuestra base de datos con, por ejemplo, una tabla con empresas, entre cuya 
información se incluya una lista de las ciudades en las que cada empresa tiene 
sede. Una empresa puede tener sedes en distintas ciudades, y una ciudad puede 
acoger a varias empresas, con lo que tanto ciudades como empresas pueden estar 
vinculadas a más de una tupia en la otra tabla. 

8.2.5. Sistemas gestores de bases de datos 

Junto con las bases de datos, el elemento fundamental para el aprovechamiento 
de estas son los Sistemas Gestores de Bases de Datos (SGDB o DBMS, del inglés 
DataBase Management System ). Estos sistemas representan un elemento interme- 
dio entre los propios datos y los programas que van a hacer uso de ellos, facilitando 
las operaciones a realizar sobre aquellos. En nuestro caso, son el componente que 
permite unir el SIG con la base de datos en la que se almacenan los datos espaciales 
con los que este va a trabajar. 

Un SGBD es una pieza de software compleja, ya que las situaciones a las que 
debe responder son diversas y en muchas ocasiones con requerimientos elevados, 
por ejemplo en lo que a eficiencia y volumen de datos respecta. Piénsese que una 
base de datos actual puede tener millones de registros y ser utilizada simultánea- 
mente por miles de usuarios, que a su vez pueden utilizar diversos programas, no 
todos ellos del mismo tipo. Por ejemplo, una base de datos que contenga números 
de teléfono, nombres de usuarios, direcciones y coordenadas asociadas a cada línea 
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telefónica, puede ser empleada desde un SIG para crear un mapa que muestre la 
densidad de usuarios o también desde una aplicación que genere un listín telefónico, 
o bien desde una aplicación en una página Web que permita localizar el número 
de teléfono de una persona concreta. Cada una de estas aplicaciones realiza un 
trabajo distinto, pero todas ellas utilizan la misma base de datos. El SGBD debe 
proporcionar a todos ellos la metodología adecuada para extraer del conjunto de 
datos completo cuanto sea necesario en cada caso. 

Además, el SGBD es la herramienta utilizada no solo por quienes aprovechan 
los datos, sino también por aquellos que se han de encargar de la propia gestión y 
mantenimiento de la base de datos. Administrar una base de datos puede suponer 
una tarea altamente compleja, por lo que el SGBD debe proveer los útiles necesarios 
para llevar a cabo ese mantenimiento. 

Para ser de verdadera utilidad y responder a todas las necesidades que pueden 
plantearse en relación con la base de datos, un SGBD debe perseguir los siguientes 
objetivos: 

■ Acceso transparente a los datos. La base de datos ha de poder accederse 
de forma transparente, sin que sea necesario para el usuario del SGBD 
preocuparse por aspectos internos relativos a la estructura de esta u otras 
características. Esto significa que, por ejemplo, si queremos recuperar un regis- 
tro de la base de datos, debemos poder hacerlo sin necesidad de saber si dicha 
base de datos está almacenada en un único archivo o varios, o si el registro que 
pretendemos recuperar está almacenado a su vez de uno u otro modo. Así, el 
SGBD debe crear una abstracción de los datos que haga el trabajo con estos 
más sencillo, ocultando aspectos que no sean relevantes para dicho trabajo. 
Procedimientos como las consultas que veremos en el capítulo 11 se realizan 
a través del SGBD, que es quien se encarga de interpretar dichas consultas, 
aplicarlas sobre la base de datos y devolver el resultado correspondiente. 
El SIG no accede a los datos, sino que se comunica con el SGBD y deja en 
manos de este el proceso de consulta en sí. 

■ Protección de los datos. Si la base de datos almacena información sensible, 
el SGBD debe controlar el acceso a esta, restringiendo el acceso cuando corres- 
ponda (por ejemplo, estableciendo distintos permisos de acceso para distintos 
tipos de usuarios) e implementando los mecanismos de protección necesarios. 

■ Eficiencia. Acceder a los datos no es suficiente en la mayoría de los casos, 
sino que se requiere un acceso eficiente. El SGBD debe ser capaz de ges- 
tionar de forma fluida grandes volúmenes de datos o de operaciones (por 
ejemplo, muchos usuarios accediendo simultáneamente), de modo que dé 
una respuesta rápida a las peticiones de los usuarios de la base de datos. 

■ Gestión de transacciones. Las operaciones sobre la base de datos tales 
como la adición o borrado de un registro se realizan mediante transacciones. 
Una transacción es un conjunto de operaciones realizadas por un usuario 
sobre la base de datos como una única unidad de trabajo, de forma indivisi- 
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ble. El SGBD ha de encargarse de gestionarlas de manera eficiente y segura 
para que todos los usuarios de la base de datos puedan hacer su trabajo de 
forma transparente. Aspectos como el acceso concurrente a la base de datos 
(varias transacciones simultaneas) resultan especialmente importantes, y en 
su buena gestión se pone gran esfuerzo en el diseño de los SGBD. 

Se denomina transaccional al SGBD capaz de garantizar la integridad de 
los datos, no permitiendo que las transacciones puedan quedar en un estado 
intermedio. Esto implica la capacidad de poder volver a un estado anterior 
en caso de que por cualquier causa (error en el sistema, fallo eléctrico, etc) 
no haya podido completarse la transacción. 

La figura 8.3 esquematiza el papel que el SGBD juega en el manejo y empleo 
de los datos. Tanto los distintos usuarios (en el caso de nuestro supuesto de gestión 
forestal pueden ser desde el gestor forestal al cartógrafo encargado de actualizar los 
limites de las unidades inventariables) como el administrador de la base de datos 
acceden a esta a través del SGBD. No existe acceso directo a la base de datos. 



Figura 8.3: Representación esquemática del papel de un Sistema Gestor de Base de Datos. 

El SGBD tendrá unas u otras características en función del modelo de base de 
datos subyacente, ya que debe adaptarse a las características de este para ofrecer 
las funcionalidades correspondientes en el nivel de usuario. 

8.2.6. Diseño y creación de una base de datos 

Una vez se toma la decisión de emplear una base de datos, el siguiente paso es el 
diseño y creación de esta. El diseño implica la definición de la estructura que va a te- 
ner la base de datos, que se deberá realizar teniendo en cuenta principalmente el tipo 
de datos que van a almacenarse y el modelo de base de datos elegido. El diseño debe 
adecuarse al uso previsto de la base de datos, de tal modo que acomode los datos de 
la mejor forma posible para cumplir los objetivos enunciados anteriormente en este 
mismo capítulo. Para ello debe conocerse la naturaleza de los datos que van a alma- 
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cenarse (no necesariamente datos de los que se dispone en el momento de la creación, 
sino los que se espera pasen a formar parte de la base de datos a lo largo de su ciclo 
de vida), así como la de los algoritmos y procesos que van a emplearse sobre ellos. 

Posteriormente al diseño, debe procederse a la implementación de la base de 
datos, esto es, a la creación propiamente dicha, incorporando los datos según los 
esquemas escogidos en la fase de diseño. Por último, y una vez creada la base 
de datos, debe procurarse un mantenimiento para que esté continuamente en 
condiciones de ser utilizada. 

Más concretamente, pueden distinguirse las siguientes fases en el proceso global 
de desarrollo de una base de datos: 

■ Diseño lógico. Independiente del SGBD empleado, es un diseño conceptual 
que pretende modelizar el contenido de la base de datos. 

■ Diseño físico. Es la adaptación del diseño conceptual a las particularidades 
del SGBD escogido. 

■ Implementación. Introducción de los datos en la base de datos. 

■ Mantenimiento. Monitorización de la actividad sobre la base de datos. 

La primera fase en el diseño de una base de datos implica un análisis de los 

datos que se van a recoger. Como resultado de ese análisis debe surgir un modelo 
conceptual que exprese la estructura de la información, siendo dicha estructura 
susceptible de ser empleada como esquema base para la base de datos en cuestión. 
El modelo conceptual ha de definir básicamente los tipos de datos a tratar y las 
relaciones existentes entre ellos, elementos que serán luego expresados en términos 
del modelo de base de datos elegido (relacional, orientado a objetos, etc.) una vez 
se pase a la fase de diseño físico. 

El modelo conceptual debe estructurar la información de forma que el usuario 
de la base de datos comprenda de forma sencilla el contenido y forma de esta. Por 
tanto, debe desarrollarse teniendo presentes las necesidades de los usuarios y el 
hecho de que estos no necesariamente han de ser especialistas en bases de datos, 
sino especialistas en los propios datos en sí. Por otra parte, el modelo debe intentar 
capturar del mejor modo posible la realidad que se pretende modelizar, por lo que 
el conjunto de tipos de datos y relaciones debe elaborarse de modo similar a dicha 
realidad para recoger toda la complejidad del sistema. Y, por supuesto, el modelo 
debe poder ser implementado posteriormente y utilizado en conjunto con el SGBD 
escogido, ya que de otro modo no presenta utilidad práctica. 

Existen diversas metodologías para desarrollar un modelo conceptual. Una de 
las más extendidas por su sencillez y potencia es la del modelo entidad-relación 
(abreviadamente, modelo E-R). 

Denominamos entidad a un objeto o concepto del mundo real acerca del cual 
se recoge información, y que puede diferenciarse de otros objetos, incluso si son de 
su misma clase (un ordenador, por ejemplo, es un objeto, y puede diferenciarse de 
otros ordenadores, incluso si son de idénticas características, ya que no son todos 
el mismo objeto y ese en particular tendrá alguna propiedad distinta, como puede 
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ser el número de serie) . La entidad puede tener sentido físico o bien ser una idea 
abstracta, como un tipo de deporte, una clase de música o una palabra. 

Una entidad se describe mediante una serie de características o atributos, que 
son las que definen su naturaleza y sus propiedades. Una colección de entidades es 
un conjunto de entidades distintas (que representan a objetos distintos), las cuales 
comparten unos atributos comunes. Por ejemplo, un conjunto de ordenadores de 
los cuales se conocen los atributos modelo , marca y procesador. 

Por su parte, una relación expresa la dependencia existente entre entidades y 
permite la asociación de estas. No resulta difícil ver que estos conceptos — entidad, 
atributos y relación — guardan un notable paralelismo con las ideas del modelo 
relacional que ya conocemos. Así, y aunque no resulte por completo inmediato, es 
sencillo traducir un modelo entidad-relación (conceptual) a un modelo relacional, 
que constituye ya un modelo aplicado a un tipo particular de base de datos. Por 
ello, el modelo E-R es una herramienta potente para el diseño lógico de la base 
de datos, especialmente si esta utiliza el modelo relacional. 

Para desarrollar el diseño conceptual de una base de datos siguiendo el modelo 
E-R, estos son lo pasos principales: 

■ Partimos de una descripción textual del problema o sistema que queremos 
recoger. Esta descripción contiene los requisitos necesarios y ha de formular 
la pregunta a la que queremos que la base de datos dé respuesta. Para 
nuestro ejemplo con datos sobre personas y ciudades, el problema podríamos 
formularlo como «¿qué personas han nacido en cada ciudad?» 4 . 

■ Se toman los verbos y los sustantivos de la descripción textual. Los sustan- 
tivos son posibles entidades o atributos, mientras que los verbos son posibles 
relaciones. En nuestro caso, «persona» y «ciudad» serán entidades y «nacido 
en» una relación. 

■ Se analizan las frases y determina la cardinalidad de las relaciones y otros 
detalles. 

El modelo así creado se expresa mediante un diagrama en el que las entidades 
se representan como cajas rectangulares, las relaciones mediante rombos y los 
atributos en círculos o elipses, todos ellos con sus correspondientes nombres en 
el interior. Cuando un atributo es un identificador, se representa con su nombre 
subrayado, del mismo modo que en la definición de esquemas que ya vimos an- 
teriormente (Figura 8.4). Si el número de atributos es elevado o el diagrama es 
complejo por existir gran cantidad de tablas e interr elaciones, pueden omitirse los 
atributos para una mayor legibilidad, describiéndose en un documento adicional. 

Como ejemplo de lo anterior, la información sobre personas y ciudades que 

4 Nótese que, aunque por meras razones didácticas hemos presentado en el capítulo las tablas 
correspondientes a personas y ciudades antes de abordar lo relativo al modelos E-R y el diseño de 
la base de datos, este modelo E-R es previo a la implementación de la base de datos, y las tablas 
correspondientes al modelo relacional son solo una implementación práctica de dicho esquema, 
en este caso según los requisitos de una base de datos que utiliza dicho modelo relacional 
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Entidad 


Relación 


Atributo 


Identificador 


Figura 8.4: Simbología empleada en el modelo entidad-relación. 


venimos manejando, así como la relación «nacido en» existente entre ambas, se 
expresarían según el modelo entidad- relación con un diagrama tal como el mostrado 
en la figura 8.5. 



Figura 8.5: Ejemplo de diagrama E-R. 

El modelo E-R presenta algunas limitaciones semánticas, y no es suficiente para 
expresar con detalle la estructura de algunos tipos de información. Por esta razón, 
surge el conocido como modelo E-R extendido, que amplía el modelo E-R añadiendo 
nuevos elementos. Con su mayor potencia, el modelo E-R extendido acerca el diseño 
conceptual a los conceptos de la programación orientada a objetos, incorporando por 
ejemplo mecanismos de herencia. No obstante, el enfoque orientado a objetos recoge 
no solo la estructura del sistema de información, sino también su comportamiento 
dinámico. Para saber más sobre el modelo E-R extendido, puede consultarse [112]. 


DNI 

Nombre 

Altura 

Edad 

Ciudad 

Población 

Superficie 

50234561 

Juan Gómez 

1,85 

35 

Madrid 

6386932 

607 

13254673 

Edurne Montero 

1,60 

30 

Toledo 

80810 

232 

46576290 

Luis Urrutia 

1,75 

46 

Madrid 

6386932 

607 

38941882 

Juan Gómez 

1,71 

55 

Valencia 

1564145 

134 


Cuadro 8.4: La información de las tablas PERSONAS y CIUDADES puede recogerse en una 
única tabla como la mostrada. 

Tras el diseño lógico, el diseño físico de la base de datos ha de llevar el modelo 
conceptual a la práctica y crear un repositorio de datos que pueda ser usado 
por el SGBD. Debe, asimismo, mantener todas aquellas propiedades del modelo 
conceptual, de modo que el contenido de la base de datos siga expresando de 
forma fiel la realidad y su estructura continúe siendo fácil de comprender para los 
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usuarios. Si, siguiendo el enfoque más habitual, optamos por crear una base de 
datos según el modelo relacional, esto implica la creación de las correspondientes 
relaciones y los esquemas asociados a cada una de ellas. 

La tablas que definamos en la base de datos pueden tener consecuencias directas 
sobre el uso de esta, afectando a aspectos como el rendimiento de las operacio- 
nes que posteriormente se lleven a cabo o al volumen de datos total necesario. 
Por ejemplo, nuestra base de datos con dos tablas, PERSONAS y CIUDADES, puede 
implementarse utilizando únicamente una tabla como la mostrada en el cuadro 
8.4. Esta tabla contiene la misma información que las dos tablas anteriores, y en 
principio permite realizar operaciones similares. Si quisiéramos saber la población 
de la ciudad donde ha nacido una persona en concreto, podríamos hacerlo de igual 
modo con independencia de cuál de las estructuras mostradas tenga la base de 
datos. En un caso deberemos acudir a dos tablas y una interrelación entre ellas, 
mientras que en el otro solo es necesario emplear una tabla, la única que por otra 
parte contiene nuestra base de datos. 

Aunque la funcionalidad sea la misma, el uso de una única tabla tiene efectos 
poco deseados que se advierten rápidamente, como por ejemplo la redundancia de 
datos. La población y superficie de Madrid aparecen repetidos en dos ocasiones, y 
aparecerían más veces si hubiera en la tabla PERSONAS más tupias correspondientes 
a individuos nacidos en esta ciudad. De igual modo sucedería con otras ciudades. En 
el esquema basado en dos tablas, sin embargo, estos datos aparecen en una única oca- 
sión y no dependen del número de personas de cada ciudad cuyos datos aparecen en 
la base de datos. En una base de datos de pequeñas dimensiones como la que utiliza- 
mos de ejemplo, esta circunstancia puede parecer poco relevante, pero si trabajamos 
con millones de registros en la tabla PERSONAS la diferencia es realmente importante. 

El concepto de normalización de una base de datos tiene relación con lo ante- 
rior. Aunque no se entrará en detalles por exceder el alcance de este texto, puede 
encontrarse más información en [113]. 

Otro aspecto a tener en cuenta en el diseño físico de la tabla es elegir nombres 
adecuados para los atributos y las tablas. Los nombres deben ser inequívocos y dar 
una idea clara de la información que contienen, y un usuario debe poder identificar 
sin dificultades qué tablas y atributos son aquellos a los que debe acudir para 
efectuar una consulta y dónde se encuentra la información que busca. El atributo 
CIUDAD en la tabla PERSONAS, por ejemplo, cumple sin problemas su papel a la hora 
de establecer la relación entre esta tabla y la que recoge los datos de las distintas 
ciudades, pero si buscamos exclusivamente información sobre las personas, no es 
completamente preciso, ya que no aclara si se trata de la ciudad en la que una persona 
ha nacido o en la que habita. Siempre que pueda existir alguna duda razonable 
a la hora de interpretar el contenido de una tabla, debe intentarse solventar esta 
mediante el uso de nombres claros y concisos. Establecer una sistemática a la hora 
de nombrar atributos y respetarla a lo largo de todo el conjunto de tablas de una 
base de datos hará más fácil para los usuarios la comprensión de esta. Por ejemplo, 
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es habitual emplear el prefijo num cuando un atributo representa un conteo (y por 
tanto, su tipo de dato será de tipo entero) . Siguiendo esta convención, si quisiéramos 
añadir un campo a la tabla PERSONAS con el número de hermanos de cada individuo, 
sería más conveniente y más informativo denominar al atributo correspondiente 
numHermanos, en lugar de, por ejemplo, Hermanos. Más que seguir unas u otras 
normas para nombrar atributos y tablas, lo importante es ser consistente y tratar 
siempre de utilizar nombres que informen y no den lugar a confusiones. 

Una vez que se establece un diseño y se implementa en la base de datos, lo normal 
es que este sea relativamente estable y no varíe a lo largo del tiempo. Las relaciones, 
por su parte, sí se modifican frecuentemente, ya sea añadiendo tupias a medida que 
se incorporan nuevos datos o modificando las ya existentes. No obstante, los SGBD 
ofrecen también funcionalidades para modificar la estructura de la base de datos, 
incorporando nuevas tablas o cambiando el esquema de alguna de ellas. Estas 
funcionalidades no suelen ser accesibles para los usuarios con carácter general, sino 
pensadas para el mantenimiento de la base de datos por parte de su administrador. 

8.2.7. Bases de datos espaciales 

Todo cuanto hemos visto en los puntos anteriores constituye el conjunto de 
ideas fundamentales sobre las que se asienta la creación y uso de bases de datos 
de cualquier índole. No obstante, no hemos mencionado a lo largo de los ejemplos 
presentados ningún dato de carácter espacial, a pesar de que sabemos bien que la 
información geográfica contiene tanto una componente temática como una espacial. 
Más aún, algunos de los atributos en los sencillos casos mostrados, como puede ser 
el atributo CIUDAD, son fácilmente asociables a elementos geográficos (por ejemplo, 
un punto que señale el centro de la ciudad o un polígono que recoja su contorno). 

Aunque las ideas anteriores no pierden su validez al incorporar datos espaciales, 
la inclusión de estos no es en absoluto obvia, y presenta una complejidad adicional 
que requiere de nuevos planteamientos para poder seguir trabajando con la base 
de datos de una forma similar a como sucede cuando se trabaja con los tipos de 
datos habituales. Mantener las características propias del SGBD en el contexto 
de los datos espaciales no es sencillo, y tampoco lo es integrar esa base de datos 
dentro de un SIG y permitir que este aproveche la potencia de dicha base de datos 
de la mejor manera posible. 

Las bases de datos espaciales representan una de las áreas dentro del manejo de 
datos donde se ha desarrollado últimamente una mayor evolución, especialmente 
debido a la gran importancia que los SIG, usuarios primordiales de este tipo de 
bases de datos, han cobrado recientemente. Esta evolución ha ido paralela a la 
forma en que los SIG han trabajado con esas bases de datos y cómo se han integrado 
en ellos las operaciones y funcionalidades que ofrecen. 

En lugar de adentrarnos en la complejidad de las bases de datos espaciales 
(aunque en el capítulo 11 veremos bastante más en lo que a las operaciones y 
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posibilidades de estas respecta) , veremos las distintas etapas que podemos encontrar 
a lo largo de la historia de los SIG en lo referente a su integración con bases de datos, 
para de este modo comprender los diversas soluciones que han ido apareciendo. 

8.3. Evolución del uso de bases de datos en los SIG 

Como acabamos de decir, los conceptos que hemos visto en las anteriores 
secciones representan una gran parte de la realidad actual en cuanto al manejo 
de datos (espaciales o no) dentro de un SIG. No obstante, el problema del acceso 
a los datos se ha solucionado de diversas formas a lo largo de la historia de los SIG, 
y encontramos en las aplicaciones SIG distintos enfoques a lo largo del tiempo. 
Para concluir este capítulo veremos con algo más de detalle la evolución que ha 
seguido esta importante faceta de los SIG. 

8.3.1. Primera generación. Ficheros 

Los primeros programas, entre los cuales se han de incluir los primeros SIG, 
se caracterizaban en lo que al almacenamiento de datos respecta por una ausencia 
completa de cualquier tipo de almacenamiento estructurado. En estas aplicaciones, 
los datos no se veían como un elemento más dentro de un sistema, sino como 
una parte del propio software o, al menos, como algo asociado únicamente a un 
producto particular. Así, encontramos en esta época como práctica habitual el 
uso de ficheros con formatos cerrados, pensados para ser leídos y escritos casi de 
forma exclusiva por la aplicación particular que ha de consumirlos, limitando así 
el uso compartido y el alcance de los datos a otros ámbitos distintos. 

Integrar en el SIG otros datos distintos a aquellos para los que la aplicación 
se había diseñado no era sencillo, ya que existía una vinculación muy directa 
entre software y datos. Asimismo, las funcionalidades del software eran también 
específicas para esos datos, y todas ellas se implementaban directamente en la 
aplicación. Al no existir un SGBD que se encargara de gestionar las operaciones, 
era el propio SIG quien debía ser responsable de las funcionalidades de acceso o 
edición. Otras funcionalidades típicas de un SGBD, sin embargo, no aparecían en 
estos primeros SIG, ya que no eran necesarias. Por ejemplo, velar por la integridad 
de los datos en operaciones concurrentes de varios usuarios no era necesario si la 
aplicación en sí no estaba diseñada para permitir este acceso múltiple. 

Las únicas ventajas que pueden encontrarse en este enfoque son las relacio- 
nadas con el rendimiento, que podía en ciertos casos ser mayor que el esperable 
en caso de utilizar un SGBD para canalizar el trabajo con los datos. Esto es así 
debido a que la propia especificidad de la aplicación permitía una optimización «a 
medida», aunque todo ello a cambio de sacrificar la flexibilidad de la aplicación, su 
escalabilidad, o la posibilidad de que los datos empleados pudieran ser utilizados 
de forma sencilla para alimentar otras aplicaciones. 
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8.3.2. Segunda generación. Bases de datos relaciónales 

Una vez que las bases de datos comienzan a tomar su papel en el panorama 
del software, no tardan en encontrar su camino dentro de las aplicaciones SIG. 
Las bases de datos relaciónales, que como ya sabemos son las más empleadas, 
comienzan a ser utilizadas también para gestionar los datos espaciales con los 
que se trabaja en un SIG. A partir de esta segunda generación, se empiezan a 
adaptar las características del modelo relacional y de las bases de datos que lo 
implementan a las particularidades de los datos espaciales. Las dificultades que 
aparecen debido a la inherente complejidad de la componente espacial hacen que 
surjan diversas alternativas para su manejo. Las más reseñables de entre ellas son 
el uso de una arquitectura dual en la que únicamente la componente temática se 
gestiona mediante una base de datos y el uso de una arquitectura en capas en el 
que se da un pleno almacenamiento de la información espacial en la base de datos. 


Arquitectura dual 

El primer intento de incorporar las bases de datos lo encontramos en el uso 
de una arquitectura dual en la cual el SGBD se hace cargo únicamente de la 
componente temática de los datos. Puesto que la dificultad estriba en el manejo 
de la componente espacial, esta no se incorpora por el momento a la base de 
datos, que trabajará únicamente con los datos temáticos. Esto permite el uso de 
sistemas gestores de bases de datos estándar, sin adaptación alguna, ya que estos se 
encuentran perfectamente preparados para el manejo de esos datos no espaciales, 
y no requieren elementos adicionales para trabajar sobre ellos. 

La componente espacial, por su parte, es gestionada por el propio SIG, en el que 
se implementan las funcionalidades necesarias. Al igual que sucedía anteriormente 
con los SIG de primera generación, no todas las funcionalidades de un SGBD han 
de aparecer necesariamente, ya que el sistema encargado de permitir el trabajo con 
los datos no es como tal un SGBD. La única diferencia reside en que en este caso 
esta circunstancia afecta tan solo a la componente espacial de los datos, mientras 
que la componente temática queda en manos de un verdadero SGBD. 

Existen, por tanto, dos subsistemas encargados de la gestión de los datos, cada 
uno de los cuales se encarga de un tipo de información (Figura 8.6). Esta arquitec- 
tura en la que datos espaciales y datos no espaciales se encuentran separados tiene 
ciertas ventajas, puesto que permite reutilizar información ya existente de uno u otro 
tipo. Por ejemplo, ficheros procedentes de aplicaciones CAD pueden incorporarse en 
el SIG aunque carezcan de una componente temática, aprovechando, no obstante la 
información espacial. Pese a carecer de muchas de las funcionalidades de un SIG, las 
aplicaciones CAD se han utilizado tradicionalmente en arquitectura y para la elabo- 
ración de cartografía, como ya vimos en el capítulo 2. El resultado de este uso es en su 
mayoría de tipo gráfico, pero un SIG que presente una arquitectura dual puede tra- 
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bajar con él y gestionarlo gracias al subsistema encargado de la información espacial, 
suponiendo ya una mejora respecto al enfoque de los SIG de primera generación. 



» t 




Figura 8.6: Arquitectura dual con subsistemas distintos para el manejo de datos 
espaciales y no espaciales. 


La división entre datos espaciales y no espaciales conlleva, no obstante, una 
serie de inconvenientes. Por un lado, resulta difícil integrar operaciones en las 
que se empleen ambas componentes de los datos, que requerirán sendas llamadas 
a ambos subsistemas y la posterior combinación de la respuesta de estos. Toda 
esta labor debe implementarse en el SIG, siendo este un proceso costoso que 
complica el desarrollo. Si todo el manejo de datos recayera sobre la base de datos, 
estas operaciones se realizarían de forma transparente, ya que bastaría ejecutar 
la operación en el SGBD y este se encargaría de realizar las tareas pertinentes y 
devolver después al SIG la respuesta. Se evitaría asimismo la redundancia en el 
propio software, ya que al emplear dos subsistemas han de duplicarse una buena 
parte de funcionalidades, una de ellas en el SGBD externo y otra en el propio SIG. 

Aunque una parte importante del SIG descansa ya sobre un SGBD, otra sigue 
presentando muchas de las deficiencias que caracterizaban a la primera generación, 
y constituyendo por tanto un punto débil en lo que a gestión de datos se refiere. 
Mientras que la componente temática disfruta de las ventajas de usar un SGBD, la 
componente espacial no goza aún de las ventajas que una base de datos provee, y 
existe una cierta descompensación que limita las posibilidades y hace más complejo 
el desarrollo del sistema. 
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Arquitectura en capas 

La otra forma de aprovechar una base de datos relacional para su uso dentro 
de un SIG consiste en incorporar toda la información dentro de la base de datos, 
incluyendo la de corte espacial, buscando la manera más adecuada de llevar esto 
a cabo pese a las limitaciones que la propia base de datos presenta en este caso. 
Asumiendo que una base de datos relacional en su concepto tradicional no esta 
diseñada para contener objetos complejos tales como geometrías o imágenes, y que, 
especialmente, el SGBD correspondiente no presenta las mismas funcionalidades 
y la misma potencia en el manejo de este tipo de datos que en el de tipos de 
dato estándar (valores numéricos, cadenas de texto, fechas, etc.), es posible, sin 
embargo, plantear soluciones que permitan llevar toda la información de un SIG 
a una base de datos y poder gestionarla por completo a través de un SGBD, con 
las ventajas que ello conlleva, y que ya conocemos. 

Dos son las alternativas existentes: un almacenamiento transparente y un alma- 
cenamiento opaco. Ambos se distinguen en la forma de almacenar la información y 
también las operaciones sobre los datos, que vienen condicionadas por la estrategia 
empleada para el almacenamiento de estos. 

En el almacenamiento transparente se emplean los propios tipos de datos del 
SGBD, y las operaciones se implementan en el lenguaje de consulta de este. Es decir, 
se intenta implementar toda la funcionalidad deseada empleando los elementos bási- 
cos del SGBD de la misma forma que haríamos si los datos a almacenar no fueran de 
tipo espacial. La componente espacial de los datos se almacena empleando tupias, va- 
riando según la implementación la manera en que esto se lleva a cabo. Una geometría 
como tal no se ajusta a ningún tipo básico de datos, pero en realidad esa geometría 
no es sino un conjunto de coordenadas que definen una serie de puntos, y dichas coor- 
denadas sí que son un tipo básico susceptible de almacenarse en un SGBD común. 

En el almacenamiento opaco se emplean objetos binarios para almacenar la 
información y las operaciones se implementan externamente en la herramienta 
SIG. Al no utilizar los tipos de datos del SGBD, tampoco pueden emplearse 
las operaciones de consulta de este, y es necesario implementar los algoritmos 
correspondientes en el SIG. 

La ventaja más directa de utilizar una arquitectura en capas, ya sea mediante 
un almacenamiento transparente o uno opaco, es la facilidad para reutilizar un 
SGBD existente. Con poco esfuerzo pueden incorporarse los datos espaciales a 
un SGBD estándar, existiendo en la actualidad numerosas alternativas sobrada- 
mente probadas y con una amplia gama de funcionalidades. Esta es la opción más 
empleada hoy en día en los SIG, principalmente por esa sencillez, que permite 
una conexión sin muchas dificultades de una aplicación SIG con la mayoría de los 
SGBD de uso habitual fuera del ámbito SIG. 

Existen, no obstante, inconvenientes y aspectos mejorables, achacables a la 
nula especialización de los SGBD para el manejo de información espacial. En el caso 
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del almacenamiento opaco, no poder emplear el lenguaje de consulta del SGBD 
constituye un grave inconveniente. Por su parte, en el almacenamiento transparente 
sí que puede emplearse, pero no todas las operaciones necesarias para el trabajo con 
datos espaciales pueden implementarse con un lenguaje de consulta no adaptado a 
las particularidades de los datos espacial, por lo que la funcionalidad es limitada. 

Asimismo, la eficacia es limitada, ya que en un caso los algoritmos son externos 
al SGBD y en el otro las consultas suelen ser complejas y operan sobre un elevado 
número de tupias, necesario para recoger la información espacial. 


8.3.3. Tercera generación. Bases de datos extensibles 

En la actualidad, las bases de datos presentan arquitecturas extensibles que 
permiten ser adaptadas a la naturaleza de los datos con los que trabajan, de tal 
forma que enfocan sus funcionalidades hacia la tipología particular que se manejen. 
Los tipos de datos clásicos que ya se han citado conviven con nuevos tipos de datos 
que pueden ser definidos, y con operaciones específicas para estos. 

Un caso particular de estas bases de datos extensibles son las bases de datos 
orientadas a objetos, que ya fueron comentadas al presentar los distintos modelos 
de bases de datos. A pesar de que este tipo de bases de datos no ocupan una porción 
significativa en el mercado global de las bases de datos y son las de tipo relacional 
las más extendidas, existen algunos sectores en los que han logrado una mayor pene- 
tración, entre ellos el del SIG. Por sus características, las bases de datos orientadas 
a objetos resultan ventajosas para el manejo de datos complejos que no puedan 
recogerse con facilidad utilizando los tipos de datos clásicos de una base de datos 
relacional. En este grupo pueden incluirse las primitivas geométricas que utilizamos 
en un SIG para recoger la componente espacial de un dato espacial, las cuales resul- 
ta más adecuado considerar como objetos de un tipo dado (punto, línea o polígono) , 
aprovechando así las ventajas que un enfoque orientado a objetos proporciona. 

La principal ventaja de una base de datos orientada a objetos es su mayor 
eficiencia en el acceso a datos, lo que se traduce en consultas más rápidas en 
comparación con una base de datos relacional (veremos más sobre consultas en 
bases de datos espaciales en el capítulo 11). Por el contrario, carece de la base 
matemática de esta, por lo que el soporte para esas consultas es menos robusto. 
Para saber más sobre bases de datos orientadas a objetos, puede consultarse [114]. 

Los SGBD actuales presentan en su gran mayoría extensiones dedicadas al 
manejo de datos espaciales, los cuales contienen todo lo necesario para el manejo óp- 
timo de estos, la realización de ciertas operaciones fundamentales y la optimización 
de las consultas y operaciones. Esta optimización es posible ya que el tipo de datos 
espacial está plenamente integrado en la base de datos y es considerado de la misma 
manera que cualquiera de los tipos de datos estándar como puede ser una cadena de 
texto o un valor numérico. La eficiencia que se obtiene de este modo es muy elevada. 


8.4. Resumen 


En este capítulo hemos visto los conceptos básicos sobre bases de datos. Una 
base de datos constituye un sistema que permite un manejo adecuado de los datos, 
garantizando la seguridad e integridad de estos y permitiendo el acceso a distintos 
usuarios de forma transparente. La base de datos está formada por los datos en 
sí, organizados de forma estructurada, mientras que las operaciones las provee el 
sistema gestor de base de datos (SGBD). 

Existen diversos modelos para el almacenamiento de datos, siendo el modelo 
relacional el más habitual en la actualidad. En el modelo relacional la información 
se organiza en tablas relacionadas entre sí. Cada fila de una base de datos conforma 
una tupia, que contiene la información correspondiente a una entidad dada. 

El diseño de la base de datos es de gran importancia, y conlleva el diseño 
de un modelo conceptual, el diseño de un modelo físico, la implementación y el 
mantenimiento. Herramientas como los diagramas E-R son de ayuda en las fases 
de diseño, cuyo principal objetivo es crear una estructura de la base de datos que 
facilite la interpretación de la información contenida y permita sacar el máximo 
rendimiento de esta. 

En lo que a los SIG respecta, las bases de datos se han ido incorporando paulati- 
namente a la gestión de los datos espaciales. Partiendo de una situación inicial en la 
que no se empleaban sistemas gestores de bases de datos, estos han ido integrándose 
en los SIG de diversas formas. En la actualidad, se emplean bases de datos relació- 
nales, que son adaptadas para poder almacenar datos espaciales y poder realizar 
operaciones sobre ellos. Los SGBD extensibles representan la ultima tendencia, 
y en ellos puede integrarse plenamente la información geográfica de forma óptima. 



Parte III 
El análisis 




Capítulo 9 


Introducción. ¿Qué puedo hacer con un SIG? 


En este capitulo se presentan algunas nociones básicas sobre análisis espacial y su 
significado. Con ellas, se podrá abordar posteriormente la presentación de formulaciones 
específicas de diversa índole, que serán las piezas fundamentales del estudio de datos 
espaciales dentro de un SIG. 

Al acabar el capítulo se tendrá un concepto general de las distintas clases de operaciones 
analíticas que serán desarrolladas en esta parte del libro. Para estudiar este capítulo es 
necesario previamente conocer los diferentes tipos de datos que se manejan en un SIG, 
de cara a poder entender la disposición de estos a uno u otro tipo de análisis. 


9.1. Introducción 

El análisis de los datos geográficos es, junto con la generación cartográfica, 
una de las tareas fundamentales sin las cuales el concepto de SIG no alcanza su 
verdadero significado. La información que manejamos en un SIG es a su vez una 
fuente de nueva información, y solo es a través de su análisis como podemos obtener 
esta última y sacar partido de ella. 

Los datos espaciales contienen mucha más información de la que a primera 
vista nos muestran. Todo dato espacial es el resultado de un proceso localizado 
espacialmente, el cual podemos conocer en mayor medida si sabemos «leer» la 
información subyacente que dicho dato contiene. Los cursos de los ríos informan 
sobre la estructura del terreno o la fitología existente. Los patrones en los que se 
disponen los nidos de una especie de ave dicen mucho acerca del comportamiento 
de esta. Y así, muchos otros ejemplos que pueden analizarse según alguna o varias 
de las formulaciones que veremos a lo largo de esta parte del libro. Lo importante 
es conocer qué formas hay de de convertir la información espacial en información 
sobre un proceso dado, o cómo extraer parámetros de utilidad a partir de datos 
espaciales relacionados con nuestro área de estudio. 

Ahora que ya conocemos cómo son los datos que podemos incorporar a un SIG, 
es el momento de ver cómo los SIG constituyen herramientas de gran potencia 
para estudiar dichos datos. El análisis de estos datos geográficos ha cobrado una 
nueva dimensión desde la aparición de los SIG, surgiendo nuevos planteamientos y 
mejorándose los ya existentes. A lo largo de toda su historia, el análisis ha sido uno 
de los elementos más importantes de un SIG, y a día de hoy existen formulaciones 
que cubren casi todo el abanico posible de necesidades. Dados unos datos espaciales 
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y un problema a resolver, es probable que exista algún procedimiento que, si no 
nos da una solución como tal a partir de dichos datos, pueda emplearlos para 
acercarnos a esta. El objetivo de esta parte del libro es mostrar los más importantes 
de dichos procedimientos, con el fin de dejar clara la potencialidad de los datos 
espaciales en los más diversos contextos de estudio. 


9.2. ¿Qué es el análisis espacial? 

De modo formal, podemos decir que el análisis espacial es el estudio cuanti- 
tativo de aquellos fenómenos que se manifiestan en el espacio [115]. Ello indica 
una importancia clave de la posición, la superficie, la distancia y la interacción 
a través del propio espacio. Para que estos conceptos cobren sentido, se necesita 
que toda la información esté referenciada espacialmente. 

En otros tipos de datos, el orden en que los elementos, indexados de una u 
otra forma, se dispongan no es relevante, y una reestructuración de los mismos no 
afecta necesariamente a los resultados. En el caso del dato espacial, este supuesto 
no se cumple, y alterar la distribución espacial de los valores de partida implica 
que los resultados de cualquier análisis espacial serán distintos. Esto nos permite 
definir tal análisis espacial como el conjunto de técnicas y modelos que hacen un 
uso explícito de la referencia espacial de cada dato particular [116]. 

Desde un punto de vista menos formal, podemos entender el análisis espacial 
sencillamente como el conjunto de operaciones que desarrollamos en base a los 
datos espaciales en el trabajo habitual con estos. En realidad, prácticamente todo 
cuanto hacemos con los datos espaciales constituye alguna forma de análisis. Pese 
a que, como ya sabemos, la aparición de los SIG ha propiciado un fuerte desarrollo 
en este terreno, el análisis espacial no es algo novedoso, y todos en algún momento 
hemos utilizado algún mapa clásico y efectuado algún análisis sobre él. 

Por ejemplo, hemos cogido un mapa de elevaciones y hemos buscado dónde se si- 
túa el pico más alto, o bien hemos visto la elevación concreta a la que se encuentra un 
elemento dado como, por ejemplo, una población. Igualmente, hemos mirado en un 
mapa de carreteras intentando planificar una jornada turística, viendo qué lugares 
de interés podemos visitar o cómo llegar desde uno a otro de estos lugares haciéndolo 
por las mejores carreteras o de la forma más rápida. Estas actividades habituales son 
ejemplos de análisis geográficos que podemos igualmente realizar dentro de un SIG. 

Cuando los datos espaciales que se recogen en ese mapa de elevaciones o ese 
mapa de carreteras pasan al marco de un SIG, se incorporan igualmente a un 
marco de análisis en el que además se contempla otra serie de operaciones. Dentro 
de ese marco, se da por igual una formalización de los métodos de análisis espacial, 
fundamentada sobre todo en la naturaleza numérica y cuantitativa con la que se 
maneja todo dato espacial dentro de un Sistema de Información Geográfica. Esta 
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formalización es la que provee el entorno adecuado para plantear todo tipo de 
análisis cuantitativos sobre los datos espaciales. 

No debe verse el análisis espacial como un conjunto de complejos algoritmos, 
sino como una colección de procesos con los que explotar los datos espaciales. Estas 
operaciones producen resultados de diversa clase, como pueden ser los siguientes: 

■ Capas de datos geográficos, en cualquiera de los formatos posibles, y con 
cualquier tipo de información. 

■ Tablas de datos. 

■ Escalares o vectores. 

En ocasiones, los resultados expresan la misma variable que el dato de partida 
(por ejemplo, el cálculo de una media), y en otros las variables de entrada y salida 
son distintas (por ejemplo, si a partir de una capa de elevaciones calculamos una 
de pendientes). 

Asimismo, todo análisis espacial parte de un conjunto de datos espaciales, 
pudiendo estos ser de un único tipo, o de varios distintos que se combinan en un 
procedimiento concreto. Por ejemplo, en el caso de calcular la localización del 
punto más alto el resultado es una sencilla coordenada, y tan solo se utiliza la 
variable elevación. En el caso de la altura media de una ciudad, se utilizan dos 
entradas. Por un lado, la elevación, y por otro el emplazamiento de la ciudad. 
Aunque en ese mapa de carreteras que antes citábamos toda esa información se 
contiene en una única hoja, en realidad son dos elementos distintos combinados 
a la hora de representarlos. En términos más acordes con un SIG, podemos decir 
que tenemos dos capas distintas que utilizamos como entradas. 


9.3. Razonamiento y consulta geográfica en un SIG 

Tanto si la información geográfica se encuentra dentro de un SIG como si no, las 
distintas herramientas de análisis espacial permiten estudiar los datos geográficos 
con el fin de obtener respuestas a cuestiones muy variadas. Estas cuestiones son 
las que motivan el propio análisis espacial y el desarrollo de las formulaciones 
correspondientes . 

A lo largo de esta parte del libro veremos una amplia serie de dichas formu- 
laciones. Utilizando estas, obtenemos de los datos espaciales los valores que sirven 
como respuesta a las cuestiones planteadas. Sin embargo, la mayor importancia 
a la hora de plantear un análisis espacial apropiado no recae sobre los algoritmos, 
sino sobre los planteamientos previos. Es decir, no sobre las respuestas, sino sobre 
las preguntas que nos planteamos acerca de los datos y los procesos espaciales. Por 
ello, es importante desarrollar un adecuado razonamiento espacial y conocer bien 
el tipo de cuestiones que podemos plantear y cómo formular estas. 

Según [117], pueden distinguirse las siguientes categorías de cuestiones geo- 
gráficas: 
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■ Relativas a posición y extensión 

■ Relativas a la forma y distribución 

■ Relativas a la asociación espacial 

■ Relativas a la interacción espacial 

■ Relativas a la variación espacial 

Por su part, [118] cita la siguiente lista como compendió básico de las cuestiones 
que pueden plantearse en el análisis espacial. 

■ ¿Dónde se encuentra? 

■ ¿Dónde tiene lugar? 

■ ¿Qué hay ahí? 

■ ¿Por qué esta ahí? 

■ ¿Por qué no está en otro lugar? 

■ ¿Qué podría haber ahí? 

■ ¿Podría estar en otro lugar? 

■ ¿Cuánto hay en ese lugar? 

■ ¿Hasta dónde se extiende? 

■ ¿Por qué tiene esa estructura particular? 

■ ¿Existe regularidad en esa estructura? 

■ ¿De qué naturaleza es esa regularidad? 

■ ¿Por qué el patrón de distribución espacial tiene que mostrar regularidad? 

■ ¿Dónde se encuentra en relación a otros de su misma clase? 

■ ¿Qué clase de distribución conforma? 

■ ¿Se encuentra en todo el mundo? 

■ ¿Es universal? 

■ ¿Donde están sus límites? 

■ ¿Cual es la naturaleza de esos límites? 

■ ¿Por qué esos límites acotan su distribución? 

■ ¿Qué otras cosas encontramos asociadas espacialmente a ese fenómeno? 

■ ¿Aparecen esas cosas asociadas espacialmente en otros lugares? 

■ ¿Por qué deben estar asociadas espacialmente? 

■ ¿Ha estado siempre allí? 

■ ¿Cuándo apareció por primera vez? 

■ ¿Cómo ha variado espacialmente a través del tiempo? 

■ ¿Qué factores han influido en su dispersión? 

■ ¿Por qué se ha dispersado de esa manera? 

■ ¿Qué factores geográficos han limitado su dispersión? 

Con todo lo anterior, un SIG es una herramienta de primer orden tanto para 
formular cuestiones geográficas como para resolverlas. 

Por ejemplo, a través de la mera representación de los datos geográficos, 
un SIG puede ayudar a identificar y definir los problemas a plantear, ya que 
la exploración visual de los datos es un elemento clave en la formulación de 
interrogantes geográficos. Esa misma representación puede ser también empleada 
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para dar respuesta a dichos interrogantes, ya que estas respuestas quedan muchas 
veces patentes con el simple análisis visual. Considerando la gran variedad de formas 
en que los datos espaciales pueden representarse dentro de un SIG, ello hace que la 
visualización sea de por sí una componente de los SIG de gran interés para el análisis. 

Asimismo, mediante las capacidades de superposición de capas y la visualiza- 
ción de dicha superposición se pueden tratar en un SIG las cuestiones relativas a la 
asociación entre distintas variables espaciales, y las que conciernen a la variación 
temporal de estas variables pueden estudiarse con conjuntos de representacio- 
nes sucesivas a modo de «instantáneas». También en esto las funcionalidades de 
visualización de la información espacial son herramientas de indudable utilidad. 

A lo anterior deben sumarse los distintos algoritmos de análisis geográfico, que 
iremos viendo a lo largo de los próximos capítulos, y que aprovechan la arquitectura 
particular de un SIG para explotar en profundidad la información espacial. 


9.4. Tipos de análisis espacial 

A la hora de analizar los datos en busca de respuestas a cuestiones como las 
anteriores, existen muchos enfoques distintos. La búsqueda de una respuesta a una 
pregunta formulada sobre un dato espacial puede abordarse de distintas maneras, 
y establecer una clasificación de estas o de las formas de proceder en el análisis 
de datos espaciales es complejo. 

Aunque dar una taxonomía del análisis espacial es difícil y la casuística es 
excesivamente amplia, podemos establecer algunas divisiones principales. Para 
cada una de ellas, veremos algunos ejemplos, con el objetivo de cubrir distintos 
supuestos y, una vez más, mostrar en detalle qué tipo de operaciones pueden rea- 
lizarse a partir de datos espaciales. Estas divisiones no pretenden ser un conjunto 
exhaustivo ni una clasificación formal, sino simplemente hacer ver la variedad de 
análisis posibles y su complejidad. 

Debe resaltarse que la implementación de estos distintos tipos de análisis, 
así como la de las formulaciones más detalladas que iremos viendo en sucesivos 
capítulos, varía de unos SIG a otros. Nuevamente, aquí se tratan como elementos 
teóricos y su utilización práctica en un SIG dado puede ser de una forma u otra. Lo 
importante, no obstante, es conocer ese elemento conceptual y saber qué podemos 
obtener a partir de un determinado dato espacial, para poder así estudiar un 
problema concreto y plantear una forma de resolución del mismo. 

Asimismo, hay que señalar que estos grupos no forman conjuntos disjuntos, 
sino que se solapan en muchos aspectos. Muchas de las metodologías que más 
adelante veremos comparten elementos de varios de estos conjuntos. 

Las siguientes son algunas de las familias principales en las que englobar los 
procedimientos de análisis: 

■ Consulta espacial. El tipo de análisis más simple es la consulta directa de la 
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información que contienen los datos espaciales. Es el tipo de análisis básico que 
usamos cuando trabajamos con cartografía clásica, y nos proporciona informa- 
ción inmediata a partir de una simple observación de los datos. La propiedad 
fundamental que empleamos es la posición de cada elemento geográfico. 
Este tipo de operaciones da respuestas a preguntas de tipo 

¿Qué tipo de suelo encontramos en una coordenada (x,y) dada? 

¿Dónde se encuentra la localidad x? 

Son, como puede verse, análisis que se pueden resolver simplemente «miran- 
do» al mapa que contiene la información de partida, y por ello constituyen 
la forma más sencilla de análisis espacial. 

Puesto que en la información geográfica dentro de un SIG todo elemento 
tiene asociadas unas propiedades en forma de valores, también podemos 
consultar estos valores. Así, podemos plantear consultas no necesariamente 
relacionadas con la componente espacial, tales como 

¿Cuáles son las diez ciudades españolas con mayor población? 

¿Qué pueblos de España comienzan por la letra A? 

Combinar este tipo de consultas con las puramente espaciales constituye 
un análisis sencillo pero fundamental dentro de los posibles en un SIG, y 
representa una de las utilidades más frecuentemente empleadas de estos en 
el trabajo diario. 

■ Análisis topológico. Las consultas hechas a las capas de datos espaciales 
pueden tener relación no solo con su posición sino con la relación con otros 
elementos de la misma capa. La existencia de topología (ver 5.3.2) puede 
emplearse para la realización de consultas que respondan a cuestiones como, 
entre otras, las siguientes: 

¿Cómo llegar desde mi posición actual hasta una coordenada concreta 
por la red viaria existente? 

¿Qué comunidades autónomas comparten límite con Madrid? 

■ Medición. La existencia de una referencia espacial para cada uno de los 
elementos con los que trabajamos en el análisis dentro de un SIG hace que 
podamos cuantificar otra serie de parámetros también espaciales. El más 
básico de estos parámetros es la distancia, que puede ser una distancia simple 
entre dos puntos dados o bien una distancia entre elementos complejos tales 
como polígonos o líneas, o combinaciones de ellos. 

Además de la distancia podemos medir otras propiedades tales como 

Área 

Perímetro 

Longitud de un recorrido no lineal 

Factores de forma 

Dentro de este grupo incluimos parámetros más elaborados tales como 
pendientes, o índices diversos que derivan todos ellos de medidas sencillas 
similares a las anteriores. Estas medidas no tiene que ser necesariamente 
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de tipo espacial, ya que conceptos como la pendiente pueden medirse no 
solo sobre un espacio geográfico — variación de z sobre el plano xy — sino 
también sobre otras variables — variación de dicha variable (temperatura, 
concentración de un nutriente, etc.) sobre el plano xy — . 

Responden a preguntas muy variadas tales como 

¿Qué superficie de zonas arboladas hay en mi término municipal? 
¿Cuántos kilómetros comprende la red viaria española? 

¿Tienen las distintas zonas de usos de suelo formas compactas o por el 
contrario son principalmente alargadas y de tipo fusiforme? 

■ Combinación. Uno de los procedimientos más habituales y más caracte- 
rísticos dentro del uso de un SIG es la combinación o superposición de varias 
capas de información. La propia estructura de la información geográfica en 
capas facilita notablemente estos procedimientos y convierte a los SIG en 
plataformas ideales para llevar a cabo análisis donde se combina información 
sobre diversas variables. 

Antes de la existencia de los SIG, la combinación de capas implicaba la utili- 
zación de mapas en soportes tales como transparencias o acetatos, una opción 
farragosa y muy poco apta para el análisis de las combinaciones resultantes. 
Dentro de un SIG, existen metodologías para integrar la información de varias 
capas en formas muy distintas, y las nuevas capas resultantes pueden luego 
analizarse con sencillez independientemente de su origen, como una capa más. 
La estructura de las bases de datos geográficas es idónea para integrar toda 
la información disponible acerca de una región geográfica concreta, y las 
distintas capas que forman esta se pueden combinar de forma sencilla tanto 
para su análisis como para su simple visualización. 

■ Transformaciones. Podemos englobar dentro de este grupo una amplia 
serie de procedimientos que modifican los elementos de entrada de diversas 
formas. 

Por ejemplo, uno de los procedimientos más frecuentes dentro de un SIG es la 
creación de áreas de influencia. Este tipo de operaciones de análisis convierte 
los distintos elementos geográficos en áreas que reflejan la influencia de dicho 
elemento en base a parámetros tales como distancias o costes. Se tiene así 
una transformación geométrica, ya que la forma del objeto se transforma 
en una nueva que indica la zona que se ve afectada por dicho objeto. 

Con ellas podemos responder a preguntas como 

¿Qué puntos de la ciudad no tienen una farmacia a menos de un kilómetro 
de distancia? 

¿Están los distintos comercios de un barrio demasiado juntos, de forma 
que probablemente estén compitiendo por la clientela? 

Si considero que para una escapada de fin de semana el turista medio 
recorre como mucho 100 kilómetros, ¿qué municipios alrededor del mío son 
susceptibles de venir de visita turística y por tanto debería promover en ellos 
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los valores naturales de este? 

Otros ejemplos de este tipo de modificaciones geométricas es la simplificación 
de líneas, que trata de definir los mismos trazados de un conjunto de lineas 
reduciendo el número de puntos empleados. 

También se pueden realizar transformaciones de las geometrías en función 
no solo de su componente espacial (sus coordenadas), sino utilizando igual- 
mente los valores asociados a estas. Un ejemplo de esto es la agrupación de 
geometrías que comparten algún atributo común en entidades únicas. Dado 
un conjunto de polígonos con los distintos términos municipales, para los 
cuales exista un atributo que indique la comarca a la que pertenecen, se 
pueden agrupar estos para obtener polígonos únicos de cada comarca. 
Otras transformaciones son de tipo cartográfico, tales como la conversión 
entre sistemas de coordenadas distintos, las reproyecciones, o la aplicación 
de transformaciones afines en general. Estas son básicas para, por ejemplo, 
combinar datos referenciados según distintos sistemas. 

Un tipo de transformación importante es la relativa a los modelos de datos, 
pues estos, como ya sabemos, son tan variados como los sistemas de coordena- 
das. Las transformaciones entre formatos y paradigmas de almacenamiento 
son importantes para un manejo óptimo de los datos geográficos, ya que 
ciertas operaciones se realizan de manera más adecuada en unos formatos 
concretos. Igualmente, la combinación de capas requiere en muchos casos 
que estas se encuentre en un mismo formato, al igual que sucede con los 
sistemas de coordenadas. La conversión entre los modelos ráster y vectorial, 
la interpolación o el cálculo de capas de densidad son ejemplos de análisis 
que modifican la forma de representación de una realidad espacial concreta. 
Por último, encontramos transformaciones basadas en los valores de las 
variables estudiadas. Dentro de este grupo encontramos las reclasificaciones, 
que en el caso de datos categóricos transforman la identificación de cada 
elemento en una clase dada, o los cambios de escala u otras operaciones 
aritméticas tales como la normalización de una variable en un rango dado, o 
la tipificación de una variable para asimilar su distribución de valores a la de 
una curva normal. Estos últimos se efectúan sobre datos de tipo continuo. 

■ Análisis de superficies. El análisis de superficies es uno de los más poten- 
tes de cuantos encontramos en un SIG. Desde parámetros básicos como la 
pendiente o la orientación hasta parámetros morfométricos muy específicos, 
pasando por todas las herramientas del análisis hidrológico, la batería de 
operaciones disponibles es muy amplia. Aunque este análisis de superficies 
se entiende como el de la superficie terrestre (es decir, el relieve), gran parte 
de estas operaciones pueden aplicarse a cualquier otra superficie, entendien- 
do esta en su su sentido matemático. Así, la pendiente indica una tasa de 
variación y puede aplicarse a capas con valores distintos de la elevación, tales 
como temperaturas, densidades, etc. 
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■ Estadística descriptiva. Los elementos de la estadística clásica tienen sus 
equivalentes en los datos espaciales, y nos permiten calificar cuantitativa- 
mente los datos con los que trabajamos. Se incluyen aquí descriptores de 
centralidad y dispersión, de dependencia espacial o el estudio de patrones 
espaciales, entre otros muchos. Estos pueden a su vez usarse para el contraste 
de hipótesis que contengan una cierta componente espacial. 

Por ejemplo, estos estadísticos nos permiten dar respuesta a cuestiones del 
tipo 

¿Es constante la media de altura a lo largo de toda la geografía de mi país? 

¿Existe alguna tendencia de los individuos de una especie a congregarse, 
o por el contrario se dispersan por todo el territorio disponible minimizando 
el contacto con otros congéneres? 

¿Existe alguna dirección predominante en los movimientos de individuos 
de una especie o se desplazan erráticamente? 

■ Inferencia. Otro análisis estadístico de gran importancia en los SIG es el 
que permite inferir comportamientos de las distintas variables y estudiar, 
por ejemplo, la forma en que estas van a evolucionar a lo largo del tiempo. 
El establecimiento de modelos de cambio y variación representa una de las 
herramientas más actuales en el campo de los SIG, y un campo en abundante 
desarrollo. 

■ Toma de decisiones y optimización. La realización de actividades en el 
medio tiene una obvia componente espacial. Son muchos los parámetros que 
influyen en ellas, y en función de estos dichas actividades se desarrollarán de 
una forma u otra. La estructura de la información geográfica en capas dentro 
de un SIG, favorable como ya vimos para la superposición de capas, lo es 
igualmente para estudiar de forma combinada los efectos de distintos factores. 
El estudio de estos factores puede ser una herramienta clave para tomar 
decisiones relativas a la actividad sobre la que ejercen su influencia. Así, los 
procedimientos de análisis espacial nos sirven para responder a cuestiones 
como, por ejemplo, 

¿Cuál es el mejor lugar para emplazar una nueva construcción en función 
de su impacto sobre el medio? 

¿Por qué trazado es más conveniente construir una nueva carretera? 

¿Dónde situar un nuevo hospital para que el servicio en la comarca 
mejore lo máximo posible? 

Dentro de estos análisis, muchos de ellos tratan de maximizar o minimizar 
alguna función objetivo dependiente de los factores implicados, que pueden 
ser tanto variables recogidas en distintas capas como parámetros espaciales 
tales como distancias. 

■ Modelización. La creación de modelos espaciales dentro de un SIG es una 
tarea aún pendiente de mucho desarrollo. No obstante, existe un gran número 
de modelos en los más diversos campos, y la arquitectura de datos y procesos 



de los SIG es propicia para la implementación de otros nuevos. 

Modelos como los de tipo hidrológico son habituales en los SIG más popula- 
res, y la estructura ráster de los datos que se emplean generalmente en estos 
facilita en gran medida el análisis y la implementación de modelos distribui- 
dos. Otros modelos que encuentran en los SIG una plataforma idónea para 
su implementación son los basados en autómatas celulares, con aplicación 
en muchas áreas distintas. 

Como ya se ha dicho, todos estos tipos de análisis no son independientes entre 
sí, y la verdadera potencia de un SIG radica en la elaboración de metodologías que 
combinen estos. Por ejemplo, la elaboración de áreas de influencia considerando 
distancia a través de una red viaria, utilizando la topología de esta, que incorpora 
el estudio de la topología de la red, la medición de distancias sobre la misma, y 
la transformación de entidades geográficas en función de lo anterior. 

En esta breve exposición no se ha tratado de dar ejemplos particulares de 
utilización de los SIG, ya que esto se hará en la última parte del libro. En su lugar, 
se pretende dar a entender que los procedimientos que pueden implementarse en 
un SIG son muy variados, y que en función del área de interés en que trabajemos, 
haremos uso de unos o de otros. Pese a ello, es interesante conocer al menos 
someramente el amplio abanico de técnicas disponibles y el alcance de las mismas 
dentro de diversos sectores de aplicación. 

9.5. Resumen 

En líneas generales, todo cuanto hacemos con la información geográfica implica 
algún tipo de análisis. Desde una mera consulta a un modelo muy complejo, este 
análisis explora dicha información y permite obtener resultados que descubren 
otros tipos de información subyacente. 

Existe una gran variedad de procesos de análisis espacial. Estos pueden tomar 
datos espaciales de diversas clases y generar resultados también muy diversos, por 
lo que su clasificación es compleja. Algunos de los más característicos de cuantos 
podemos llevar a cabo dentro de un SIG son aquellos que sacan partido de la forma 
en que este maneja las distintas capas de información. Por ejemplo, la superpo- 
sición de capas o el análisis combinado de distintos factores como herramienta de 
apoyo en la toma de decisiones. La creación de zonas de influencia es también uno 
de los análisis más habituales, englobado dentro de un conjunto de procesos de 
transformación de datos geográficos. 

En este contexto, deben considerarse los SIG como herramientas que van a 
a permitir una mejor formulación de las cuestiones geográficas, y que del mismo 
modo van a ayudar en la búsqueda de respuestas a estas. 



Capítulo 10 


Conceptos básicos para el análisis espacial 


Para proceder al análisis de los datos espaciales, deben conocerse antes las particu- 
laridades de estos. Algunas características propias de los datos espaciales hacen que, entre 
otras cosas, no sean aplicables algunos elementos de la estadística no espacial. Otras 
condicionan buena parte de las formulaciones que operan sobre ellos, y que iremos viendo 
en los sucesivos capítulos. Por tanto, abordar el estudio de estas formulaciones no se ha de 
hacer sin antes tratar con algo más de detalle las propiedades inherentes al dato espacial 
en lo que a su disposición para el análisis respecta. 

Junto a esto, se presentan en este capítulo algunos conceptos fundamentales sobre 
geometría del plano y el espacio, y sobre las distintas relaciones entre entidades espaciales. 
Todos ellos son la base para crear análisis más complejos sobre datos espaciales. Unas 
nociones básicas de matemáticas son necesarias para poder comprender estas ideas. 


10.1. Introducción 

Trabajar con datos espaciales tiene una serie de implicaciones que han de 
considerarse con detenimiento antes de llevar a cabo cualquier análisis. A lo largo 
de esta parte del libro veremos formas muy distintas de analizar los datos espaciales 
para obtener resultados de índole variada, y todas ellas tienen en común el hecho 
de trabajar sobre este tipo particular de datos. Conocer en profundidad el dato 
espacial es, por tanto, imprescindible, no solo en lo relativo a su forma, su manejo y 
su almacenamiento — que ya fue visto en la parte correspondiente — sino también 
en lo referente a su análisis y cómo ha de tratarse e interpretarse la información 
que contiene — que lo veremos en el presente capítulo — . 

Entendemos por dato espacial todo aquel que tiene asociada una referencia 
geográfica, de tal modo que podemos localizar exactamente dónde sucede dentro de 
un mapa [119]. Dentro de esta definición se incluyen datos de campos (superficies) 
o datos asociados a objetos como puntos, líneas o polígonos. Es decir, todo cuanto 
puede recogerse según los distintos modelos de representación que ya hemos visto 
con anterioridad. 

El objetivo de este capítulo es múltiple. Por una parte, presentar las principales 
particularidades de los datos espaciales, así como la formas de tener estas en cuenta 
a la hora del análisis. Por otra, estimular un correcto razonamiento espacial y un 
entendimiento adecuado tanto de las limitaciones como de la potencialidad de 
los datos espaciales como fuente del análisis geográfico. Y por último, presentar 
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algunos de los fundamentos teóricos sobre los cuales se crean después todas las me- 
todologías de análisis, las estadísticas espaciales, y los algoritmos que se detallarán 
en los capítulos sucesivos. 

Estos fundamentos incluyen algunas nociones básicas sobre matemática del 
plano y el espacio, y conceptos sobre las posibles relaciones existentes entre objetos 
geográficos. 

10.2. Particularidades de los datos espaciales 

Considerar que el dato espacial es un dato cualquiera sin ninguna peculiaridad 
supone no realizar sobre él un análisis óptimo. Las características propias de los 
datos espaciales dotan a estos de una gran potencialidad de análisis, al tiempo que 
condicionan o limitan otras operaciones. Asimismo, estas particularidades son el 
origen de una gran parte de los retos aún existentes dentro del análisis geográfico, 
y por sus implicaciones directas no pueden desestimarse sin más. Su conocimiento 
es, por tanto, imprescindible para todo tipo de análisis espacial. 

El carácter especial del dato espacial deriva de la existencia de posición. Esta 
posición se ha de entender tanto en términos absolutos (posición de una entidad en el 
espacio expresada por sus coordenadas) como relativos (relación con otras entidades 
también en dicho espacio) . Las consecuencias de que todo dato espacial se halle por 
definición localizado a través de coordenadas son diversas, y deben enfocarse desde 
los distintos puntos de vista del análisis espacial. A continuación veremos los puntos 
más relevantes que deben considerarse a la hora de tratar con datos espaciales. 

Algunos de estos puntos representan problemas que han de tenerse presentes 
en el análisis. Otros son simplemente conceptos básicos que deben conocerse pero 
no han de implicar necesariamente una dificultad asociada. 

10.2.1. Escala 

En el apartado 3.4 vimos con detalle el concepto de escala cartográfica, y cómo 
este se aplica de igual modo a la representación y gestión dentro de un SIG. Existe, 
además, otra forma de considerar la escala, y que resulta de especial interés para 
los contenidos de esta parte: la escala de análisis. 

A la hora de estudiar la información geográfica, podemos hacerlo a distintos 
niveles y, dependiendo del nivel elegido, los resultados serán de una u otra na- 
turaleza. Esto se manifiesta en las estructuras espaciales (véase más adelante en 
esta misma sección), que condicionan los valores que se derivan de sus análisis 
a través de las distintas formulaciones de análisis. Este hecho es fácil verlo con 
algunos ejemplos, que nos permitirán comprobar cómo a distintas escalas los datos 
geográficos tienen características distintas. 

Por ejemplo, sea el conjunto de puntos de la figura 10.1. En el ejemplo a) se ve 
que los puntos se agrupan en conglomerados en zonas concretas del espacio. Esto 
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es lo que denominaremos una estructura agregada. Sin embargo, si nos acercamos 
y solo enfocamos uno de dichos grupos, el de la parte superior izquierda — ejemplo 
b) — , la estructura que vemos claramente no responde a una estructura agregada, 
sino que los puntos se disponen más o menos equiespaciados. Es lo que se conoce 
como estructura regular. Dependiendo de a qué escala observemos y analicemos 
la estructura espacial del conjunto de puntos, esta resulta de un tipo o de otro. 



a) b) 


Figura 10.1: Dependiendo de la escala de análisis, la estructura de un conjunto de puntos 
puede ser distinta. 

La escala de análisis debe ir inseparablemente relacionada con el fenómeno que 
pretendemos analizar, ya que es esta la que le da sentido. Supongamos el caso de 
llevar a cabo un análisis del relieve. Dependiendo de a qué escala observemos dicho 
relieve, la imagen que obtenemos es muy distinta. A un nivel global, distinguimos 
las grandes cadenas montañosas, y el resto del relieve aparece más o menos llano. 
Si nos acercamos a alguna de esas zonas llanas, se aprecia un relieve que antes 
no percibíamos, con ondulaciones y accidentes orográficos de menor entidad, que 
son suficientes para apreciarse a esta escala, pero no a la escala global anterior. Si- 
guiendo este proceso, podemos ir acercándonos progresivamente hasta que incluso 
un pequeño grano de arena constituya un relieve notable. 

Si vamos a llevar a cabo un estudio de cómo el relieve influye en los movimientos 
de las masas de aire a nivel de todo el planeta, no tiene sentido estudiar las formas 
del relieve a este último nivel de máximo detalle. Como se muestra en la figura 10.2, 
si para definir las formas de relieve en un punto dado lo hacemos considerando dicho 
punto y los valores de elevación a su alrededor, la caracterización que hagamos 
varía en función de la dimensión de esa zona alrededor (que es la que define la escala 
de análisis). Para valores pequeños de dicha zona de análisis, el punto analizado 
puede definirse como una cima, mientras que aumentando la escala de análisis se 
advierte que el punto se sitúa en el fondo de un valle. 

Por tanto, debemos observar el relieve desde la distancia correcta a la cual 
la información que nos proporciona es la más adecuada para un análisis dado. 
Además de existir una escala de mayor relevancia para un análisis concreto, lo 
cierto es que el conjunto de todas las escalas de análisis contiene en su totalidad 
una información más amplia que la correspondiente a una única escala, y por tanto 
resulta de interés el trabajar a múltiples escalas y combinar los resultados. 

Este enfoque de escalas múltiples es relevante también en relación con los propios 
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Figura 10.2: Dependiendo de la escala de análisis, un mismo relieve puede ser 
caracterizado como cima (a) o fondo de valle (b) 


datos, independientemente de lo que representan. Es decir, independientemente de 
la escala y la dimensión «real» , y en relación solo con la escala definida por el formato 
de los mismos. Por ejemplo, en el caso de imágenes, el uso de operadores a diferentes 
escalas (referida aquí la escala al número de píxeles utilizados en el operador) es ven- 
tajoso para realizar ciertas operaciones tales como la detección de bordes [120] (véase 
16.3.2). Combinado esto con lo anterior, la importancia de la escala en el análisis 
espacial es de primer orden, y resulta necesaria su consideración en todo momento. 

Podemos ver más ejemplos de cómo la escala de análisis condiciona los resulta- 
dos obtenidos. Supóngase un elemento lineal tal como un camino o el contorno de 
una finca cuyo perímetro quiere medirse. Como puede verse en la figura 10.3, la uni- 
dad de medida empleada provoca que se obtengan resultados distintos. Para medir 
la longitud de la línea utilizamos una unidad mínima, que podemos asimilar a una 
especie de «vara de medir» . Todos los elementos de la línea que son menores que esa 
unidad mínima no se recogen. En el caso a) se obtiene un resultado de siete unidades. 
Si reducimos a la mitad la unidad, cabe esperar que la longitud sea el doble. Sin 
embargo, obtenemos un total de 17 unidades, de forma que la proporción entre el ta- 
maño de nuestra vara de medida y el número de unidades resultante no se mantiene. 

Cuando esto sucede, podemos afirmar que carece de fundamento trabajar con 
una medida «absoluta» de longitud (u otro parámetro estudiado que se comporte 
de igual manera, tal como el perímetro de un área de estudio) , y que esto solo 
tiene sentido dentro de un contexto dado que defina la forma en que los resultados 
son medidos y operados. La unión de un valor resultante con la escala a la que se 
ha obtenido tiene en conjunto pleno significado, pero en casos como el anterior 
el valor resultante por sí mismo carece de dicho significado. Otra solución es la 
definición de parámetros invariantes a la escala, que no se ven afectados por esta. 

El concepto de fractal tiene una implicación directa en este hecho. Para saber 
más sobre fractales, la referencia clásica es [121]. 

Por último, y para concluir este apartado, señalar que las implicaciones de la 
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a) 


b) 


Figura 10.3: La unidad de medida empleada modifica el resultado obtenido. 


escala para el análisis se incorporan incluso en la representación y almacenamiento 
de los datos espaciales. Así, una ciudad puede definirse como un punto a una escala 
dada, y como un polígono si nos acercamos lo suficiente y estudiamos una porción 
concreta con más detalle. En función de su uso, puede ser más conveniente tratar el 
elemento ciudad de una u otra manera, lo cual también afecta al análisis del mismo. 

En realidad, los conceptos punto y linea no existen como tales en el espacio 
geográfico. Un elemento tal como un cauce o una línea de alta tensión, que se 
recogen ambos en una capa vectorial como líneas, en realidad tiene un grosor. 
Lo mismo sucede con los elementos puntuales. Un árbol no es un punto, sino en 
todo caso un círculo. Por motivos de escala hacemos la abstracción de considerar 
puntos o líneas, porque a la escala habitual dichos elementos (árboles, caminos, 
etc.) pueden considerarse como tales. 

También el propio formato de almacenamiento condiciona el efecto de la escala. 
Para el caso de datos vectoriales, existe el límite impuesto por la imposibilidad de 
almacenar números decimales de la precisión deseada. Es decir, la limitación del 
mínimo valor que puede almacenarse. No obstante, este límite es varios órdenes 
de magnitud inferior al definido por la precisión de los instrumentos de medida, 
con lo que no es considerable. 

Una situación distinta es la que sucede con los datos ráster, donde el tamaño 
de celda está indirectamente condicionando una escala. La medición de áreas y 
distancias se encuentra influida por el tamaño elegido. Del mismo modo que no 
podemos recoger los detalles mínimos de una curva al utilizar una vara de medir 
de mayor tamaño, en el caso de una capa ráster, todo aquello que suceda en una 
escala inferior a la definida por el tamaño de celda queda ignorado. La espacial 
resolución es, por tanto, un elemento directamente relacionado con los resultados 
del análisis cuando se utilizan datos ráster. 



244 


Sistemas de Información Geográfica 


10.2.2. El Problema de la Unidad de Área Modificable 

Uno de los problemas principales asociados al análisis de datos espaciales es el 
relacionado con la definición de unidades de análisis. Muchas de las variables con las 
que trabajamos dentro de un SIG no pueden medirse de forma puntual, y por ello han 
de estudiarse para un área dada. Ejemplos de este tipo de variables son el porcentaje 
de población en un rango de edad determinado o la densidad media de población. 

Las áreas que se definen para poder trabajar con las variables de esta índole 
son esencialmente arbitrarias. Por ejemplo, podemos estudiar el porcentaje de 
la población dentro de un intervalo de edad a nivel de país. La unidad país se 
establece sin ningún criterio propio del análisis espacial, de igual modo que podría 
haberse realizado el mismo análisis a nivel de continente o de comarca, todas ellas 
divisiones por completo arbitrarias. No obstante, la utilización de una u otra unidad 
es problemática, ya que altera los resultados extraídos de las variables estudiadas. 

Este problema, por tener relación con la elección de la unidad de agregación de 
la información, se conoce como Problema de la Unidad de Area Modificable( PUAM) 
[122] 1 , y ha sido ampliamente estudiado en la literatura. Formalmente, puede 
definirse como «un problema causado por la imposición de unidades artificiales 
de definición espacial en fenómenos geográficos continuos, teniendo ésto como 
consecuencia la generación de patrones artificiales» [123]. Aunque no se trata de 
una cuestión de reciente descubrimiento, la aparición de los SIG y las mayores 
capacidades de análisis que estos han propiciado ha atraído de nuevo el interés 
sobre el Problema de la Unidad de Área Modificable. 

Los efectos del PAUM se pueden dividir en dos componentes: uno relacionado 
con la escala y otro relacionado con la agregación. El efecto de escala describe la 
variación de los resultados obtenidos en relación con el número de zonas en que 
se divide el total de la zona de estudio. Es decir, el tamaño de las unidades. Este 
efecto esta claramente relacionado con lo visto en el punto anterior. 

Por su parte, el efecto de zonificación hace referencia a las diferencias que se 
producen cuando la información se agrega a una escala distinta. Por ejemplo, si se 
miden los datos de densidad de población por términos municipales, y posterior- 
mente estos se agregan para presentarse por comunidades autónomas, ese cambio 
en la unidad de definición da lugar a diferencias en los valores resultantes. 

Para darse cuenta de la importancia de este hecho, debe considerarse que una 
buena parte de la información geográfica que utilizamos en un SIG ha sido recogida 
originalmente a una escala distinta, y en ocasiones ha sufrido una agrupación en 
unidades mayores por motivos de mera facilidad de manejo. 

Ambos efectos, el de zonificación y el de escala, no son independientes, sino que 
están íntimamente relacionados. La intensidad con que estos dos efectos afectan al 
análisis es variable, y existe asimismo una componente aleatoria. En líneas genera- 
les, el uso de unidades pequeñas implica que el número de elementos contenidos en 


1 Modifiable Areal Unit Problem, MAUP 
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las mismas es menor y por lo tanto estadísticamente menos fiable. En el extremo 
contrario, el uso de unidades grandes da valores estadísticamente más fiables pero 
oculta la variación que se produce dentro de las propias unidades. [124], 

A pesar de tener una clara importancia en el análisis geográfico, las soluciones 
a la problemática que la definición de un área unitaria conlleva no son claras. 
Tradicionalmente se considera que se trata de un problema intratable. No obstante, 
algunos estudios [125] indican que existe un cierto grado de regularidad en los 
valores estadísticos agregados, dependiente de la autocorrelación espacial (ver 
siguiente punto) y la configuración de la variable. 

Puede afirmarse que el Problema de la Unidad de Área Modificable es aún 
materia de amplio estudio, y el objeto de este estudio, que no es otro que el poder 
calcular los valores de los datos a la resolución espacial original (es decir, sin que los 
efectos de zonificación tengan relevancia), en caso de poder alcanzarse, requerirá 
un análisis sin duda complejo. 

Un problema particular relacionado con el PUAM es la denominada falacia 
ecológica[ 122] , que consiste en asumir que los valores calculados para una unidad de 
área pueden aplicarse a los individuos de la población existente en dicha área. Sólo 
en el caso de que exista una completa homogeneidad para la variable analizada, 
lo cual muy raramente sucede, la anterior suposición sería cierta. 

10.2.3. Autocorrelación espacial 

Supóngase que se estudian una serie de poblaciones cercanas en las cuales se mi- 
de el porcentaje de personas afectadas por una determinada enfermedad infecciosa. 
Cabe esperar que, puesto que los habitantes de esas poblaciones están relacionados 
entre sí de diversas formas, la distribución de los valores recogidos obedezca en 
parte a la existencia de dichas relaciones. Por ejemplo, si en una población contraen 
la enfermedad un número dado de habitantes, es más factible que estos puedan 
contagiar a los de las poblaciones cercanas que a los de otros núcleos más alejados. 

Por lo anterior, es probable que alrededor de una población con muchos ca- 
sos de la enfermedad haya otras también con un elevado número de afectados, 
mientras que una población con pocos casos esté rodeada de otras también con 
escasa afección. Un comportamiento similar lo encontraríamos si midiéramos la 
concentración de un tóxico en distintos puntos de un embalse, ya que alrededor 
de un punto de alta concentración no parece lógico esperar concentraciones bajas. 

Ejemplos como los anteriores cumplen lo que se conoce como Primera Ley 
Geográfica de Tobler [126], que establece que «todo está relacionado con todo, pero 
las cosas próximas entre sí están más relacionadas que las distantes». 

De modo más formal, el termino autocorrelación espacial hace referencia a lo 
reflejado en los ejemplos anteriores, es decir, a la existencia de una correlación de 
la variable consigo misma, de tal modo que los valores de esta variable en un punto 
guardan relación directa con los de esa misma variable en otros puntos cercanos. 
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En el caso de la enfermedad infecciosa o la concentración del producto tóxico, 
los valores altos suelen tener en su entorno valores también altos, y de modo similar 
sucede para valores bajos. Se dice que existe una autocorrelación espacial positiva. 
Puede, no obstante, existir una autocorrelación espacial negativa , si los valores 
altos se rodean de valores bajos y viceversa. 

En caso de no existir ningún tipo de autocorrelación espacial, se tiene que los 
datos recogidos en una serie de puntos son independientes entre sí y no se afectan 
mutuamente, si que tenga influencia de la distancia. 

La figura 10.4 muestra unas sencillas capas ráster en las que se presentan los 
tres tipos de autocorrelación espacial anteriores. 



Figura 10.4: a) Autocorrelación espacial positiva, b) Autocorrelación espacial negativa, 
c) Ausencia de autocorrelación espacial (independencia) 

Las consecuencias de la existencia de autocorrelación espacial son numerosas 
y de gran importancia. 

Por una parte, muchos de los análisis estadísticos suponen la independencia 
de la variable. Puesto que existe una dependencia de la componente espacial, será 
necesario para obtener resultados correctos introducir dicha componente espacial 
como una variable más. 

Existiendo autocorrelación espacial, y siendo esta positiva, la inferencia esta- 
dística es menos eficaz que si se cuenta con un número igual de observaciones de 
una variable independiente. Es decir, se pierde parte de la capacidad explicativa 
de los datos. Esto se materializa en mayores varianzas en las estimaciones y peores 
ajustes de modelos, entre otras consecuencias. 

Puede, no obstante, sacarse también provecho de la existencia de una depen- 
dencia espacial. Puesto que los puntos cercanos a uno dado guardan relación con 
este, pueden emplearse para estimar su valor, siendo este el fundamento principal 
de los distintos métodos de interpolación (Capítulo 13). 

En lugar de incorporar la autocorrelación espacial como un elemento más, otra 
forma de proceder es analizar la intensidad de esta para ver en qué medida lo anterior 
es cierto o no. Así, el estudio de la autocorrelación espacial puede servir para juzgar 
si procede la aplicación de métodos estadísticos que no consideren la dependencia 
espacial. Como veremos en el capítulo 12, si a través de los valores de los indicadores 
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correspondientes podemos aceptar la hipótesis nula de ausencia de dependencia 
espacial, entonces los inconvenientes anteriormente citados pueden no existir. 

Como ya venimos observando, el conjunto de conceptos básicos sobre datos 
espaciales que estamos viendo en esta sección no es un conjunto de elementos inde- 
pendientes. Por ejemplo, la autocorrelación espacial se halla directamente ligada 
con el concepto de escala, y un cambio de escala puede hacer que la autocorrelación 
cambie de signo [127]. Veamos un ejemplo. 

Sea un monte en el que los árboles grandes están separados una distancia dada 
por el efecto de la competencia, y entre los cuales crecen los árboles más pequeños. 
Supongamos que la distancia media entre árboles grandes es de unos 20 metros. Si 
hacemos un muestreo en el que medimos la altura media de los árboles en parcelas 
separadas aproximadamente cada 10 metros, es probable que midamos alterna- 
mente una parcela con un árbol grande y una con algunos pequeños, de forma que 
tendremos una marcada autocorrelación espacial negativa. Si por el contrario medi- 
mos parcelas de un metro de radio separadas a su vez un metro, mediremos muchas 
parcelas cercanas en las que solo entrarán árboles pequeños que se agrupan bajo los 
grandes, de tal forma que la autocorrelación espacial que obtendremos será positiva. 

Es importante considerar todos estos factores de forma global, pues todos ellos 
tienen importancia y afectan al trabajo con datos geográficos. 

10.2.4. Existencia de estructura 

Tanto la disposición de los datos como las propiedades de la variable estudia- 
da (por ejemplo, la propia autocorrelación espacial como propiedad intrínseca), 
exhiben una estructura determinada. En la figura 10.5 pueden verse dos conjuntos 
de puntos distintos, sobre los cuales cabe plantearse si los resultados obtenidos de 
su análisis pueden darse como igual de fiables. Puesto que la estructura espacial 
de ambos es distinta y la componente espacial juega un papel importante, esta 
estructura puede condicionar los resultados y tener influencia sobre estos. 



a) b) 


Figura 10.5: Dos estructuras distintas con diferentes implicaciones a la hora del análisis 
de los datos que representan 

Por ejemplo, vemos que en el patrón b) los puntos se hallan más agrupados, 
mientras que en el a) los puntos están distribuidos uniformemente a lo largo de 
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la extensión de la zona de análisis. Si existe autocorrelación espacial positiva, la 
información recogida en el patrón b) es mucho menos representativa, ya que los 
puntos cercanos recogen información en cierta medida redundante. A pesar de 
disponer de un numero n de valores recogidos en otros tantos puntos, el análisis 
estadístico de estos no es tan preciso como si se dispusiera de n observaciones inde- 
pendientes. En realidad, los resultados que obtendremos serán como si hubiéramos 
muestreado un número menor de puntos que los que realmente tenemos. 

Los dos principales conceptos estadísticos que definen la estructura espacial 
de los datos son la estacionaridad y la isotropía. Estos se estudian principalmente 
en relación a los denominados efectos de primer y de segundo orden. El efecto de 
primer orden es el valor esperado, es decir, la media. El de segundo orden es la 
covarianza entre distintas zonas. 

La estacionaridad indica que el proceso es invariante a la traslación. Es decir, 
que las propiedades son constantes en el espacio y no existe tendencia alguna. 
La isotropía indica que el proceso es invariante a la rotación. Un proceso cuyas 
propiedades de segundo orden son isotrópicas es aquel en el que la covarianza 
presenta la misma variación en todas direcciones. 

Veremos en diversos puntos de esta parte del libro como la presencia de isotropía 
o su ausencia (anisotropía) tiene importancia a la hora de realizar distintos tipos 
de análisis. 


10.2.5. Existencia de tendencias espaciales 

Podemos decir que existe una tendencia espacial cuando los valores de una 
variable están relacionados con sus propias coordenadas geográficas. Por ejemplo, 
existe una tendencia a que la temperatura disminuya conforme nos alejamos del 
ecuador. Por ello, en un mapa de temperaturas para una región lo suficientemente 
amplia, cabe esperar valores menores en el extremo más distante del ecuador. 

El dato de localización geográfica plantea un contexto dentro del cual se sitúan 
los restantes valores, en este caso, la temperatura observada. Esto hace que el 
mismo valor de una variable no tenga el mismo significado cuando aparece en un 
punto que cuando lo hace en otro. No es lo mismo un valor de temperatura de 40°C 
en Madrid que en Oslo. El valor en sí es idéntico, pero su interpretación es distinta. 

Conocer las tendencias existentes para una variable nos ayuda a comprender 
mejor esta y analizarla de forma correcta. Si es posible cuantificar dicha tendencia, 
resulta factible eliminar su influencia de los datos, de forma que estos ya no se 
vean afectados por ella, o bien considerarla explícitamente como parte del análisis. 

Las consecuencias de la existencia de tendencias son similares a las que se 
derivan de la presencia de autocorrelación espacial, ya que invalidan el supuesto 
de independencia de los datos. 
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10.2.6. Efectos de borde 

Las zonas que estudiamos dentro de todo análisis espacial tienen unos límites 
establecidos. Estos límites vienen definidos de forma artificial — el límite de la 
fotografía aérea de la que disponemos, por ejemplo — o bien de forma natural — si 
estudiamos un bosque junto a un pantano, el bosque encuentra su límite al borde 
de este último — . 

Imaginemos un caso como este segundo y observemos la figura 10.6. Si dentro 
del bosque los árboles están plantados de forma regular (supongamos que es una 
repoblación con un marco fijo), se puede decir que en cualquier punto dentro de esa 
masa existe una densidad constante. En otras palabras, si nos situamos en cualquier 
punto de dicha masa, ya sea cerca o lejos del borde, los árboles están plantados 
con una misma densidad. No obstante, para el cálculo de la densidad necesitamos 
establecer un área de análisis puesto que no es una variable que pueda computarse 
puntualmente. Sin embargo, en las zonas de borde una parte de dicho área cae fuera 
de la masa de bosque, con lo que el número de pies será menor (ya que no hay árboles 
en la zona limítrofe, es decir, el embalse), y por tanto también lo será la densidad. 

El efecto de borde no es independiente de otros elementos como la escala, ya 
que la escala de análisis tiene un influencia directa en él. Como se ve en la propia 
figura 10.6, el porcentaje del círculo de análisis que queda fuera de la zona de 
bosque es distinto en función del tamaño de dicho círculo. 

Otros análisis que en breve veremos hacen uso de un mecanismo similar. Por 
ejemplo, analizando el número de puntos situados a una distancia menor que un 
umbral dado. En los puntos cerca del borde, la presencia de dicho borde va a distor- 
sionar los valores calculados. Como también veremos, las distintas formulaciones 
tienen en muchos casos expresiones corregidas que modifican los valores obtenidos 
en función de la distancia al borde. 



Figura 10.6: Representación del efecto borde y cómo este afecta en mayor o menor 
medida en función de la escala de análisis. Las zonas en trazo continuo no se ven afectadas. 
Las zonas en trazo punteado están afectadas de efecto de borde en diferente grado. 
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En general, es importante considerar los efectos de borde para saber si los 
valores calculados dentro de cualquier análisis estadístico son válidos o no. Cuando 
nos encontramos lo suficientemente cerca de un borde (sea este uno artificial como 
el borde de la capa o uno natural dentro de la propia capa tal como el mencionado 
límite de un bosque) , la información que derivamos de los datos espaciales puede 
ser incoherente con la realidad. 

Veremos ejemplos variados a lo largo de los siguientes capítulos, no solo 
relacionados con el análisis de datos puntuales como en los casos comentados 
anteriormente. En el apartado 14.2.2 veremos cómo el efecto de borde afecta a un 
tipo particular de análisis sobre capas ráster. En otros casos, el efecto de borde 
no se manifiesta únicamente para puntos cercanos a dicho borde, sino para todos 
aquellos relacionados o conectados con él, con independencia de su distancia a 
este. Veremos este caso en el apartado 15.6.3. 

Con relación a este último supuesto, no debe olvidarse nunca que los procesos 
que estudiamos y que analizamos a través de la información espacial están influen- 
ciados por otros procesos que pueden estar fuera del marco delimitado sobre el que 
trabajamos, alejados de él e incluso a una escala distinta. Así, estudiar la vegetación 
de una zona dada implica estudiar el clima que la condiciona. Aunque el relieve 
y las condiciones locales son los que afectan a este en primera instancia, el clima 
es un proceso global que opera a una escala mayor a la de la zona cuya vegetación 
estudiamos, y efectos fuera de dicha zona pueden tener repercusión sobre ella. 


10.2.7. Localización representada 

Como veíamos al tratar el Problema del de Unidad de Área Modificable, algu- 
nas de las variables geográficas requieren un área para ser recogidas, y no pueden 
hacerse de forma puntual. En otros casos, la necesidad de establecer unidades no 
puntuales no viene motivada por la variable recogida o la estructura geográfica que 
se estudia, sino por la forma de almacenar la información de dicha variable. Tal es 
el caso del modelo ráster, en el que el territorio se divide en unidades geométricas 
arbitrarias, generalmente unidades regulares de forma cuadrada. 

Para cada una de estas unidades, se tiene un valor de la variable estudiada, pero 
lo que dicho valor representa en el territorio puede variar en función del criterio 
establecido. Como se recoge en la figura 10.7, en la cual la variable recogida es la 
elevación, el valor de cada celda puede ser la elevación en el centro de la celda o 
bien el valor medio de toda ella, entre otras opciones posibles. 

Este tipo de cuestiones deben considerarse al trabajar con los datos espaciales, 
y homogeneizar los criterios en la medida de lo posible, siempre considerando la 
naturaleza de la variable recogida. 
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Figura 10.7: El valor recogido en una unidad puede interpretarse con distintos criterios, 
a) Media de la celda, b) Valor en el punto medio. 

10.3. Algunos cálculos espaciales básicos 

La mayor parte de los análisis espaciales hacen uso de cálculos geométricos 
sencillos, a partir de los cuales se construyen algoritmos más complejos. Veremos 
en esta sección esos cálculos básicos, que constituyen los fundamentos del análisis 
geométrico tanto en el plano como en el espacio. 

La idea de distancia es fundamental para todo análisis espacial. En el plano, 
la distancia euclídea entre dos puntos dados es 

d=\J \x2-xi) 2 + (y2-yi) 2 (10.3.1) 

En el análisis geográfico es habitual utilizar la denominada distancia de Man- 
hattan 2 , cuya expresión es 


dm = {x 2 -x 1 ) + (y 2 -yi) (10.3.2) 

Tanto la distancia euclídea como la de Manhattan son casos particulares de 
las denominadas métricas LP, que responden a una expresión de la forma 

d^ = (\\x2-xi\\ p +\\y2-yi\\ p )p (10.3.3) 

En el caso de ser p = 1 se tiene la distancia de Manhattan, y para p = 2 la 
distancia euclídea. 

Cuando se utilizan capas ráster, el concepto de distancia puede entenderse de 
un modo distinto. Como resulta lógico, puede aplicarse la distancia euclídea entre 
los centros de las celdas, pero en ciertos casos puede ser conveniente trabajar no en 
coordenadas geográficas, sino de celdas, ya que, como sabemos, el espacio se divide 
en un número finito de estas en una capa ráster. Por esta razón, y puesto que las 

2 Se denomina así debido a que es similar a la recorrida por las calles regularmente dispuestas 
tales como las de la ciudad de Manhattan. 
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coordenadas de celda son expresadas en números enteros de la forma (fila, columna) , 
resulta además conveniente que esa distancia sea también un valor entero[128]. 

Sobre este planteamiento pueden definirse distintos tipos de distancia ráster con- 
siderando principalmente el número de celdas por las que debe pasarse para ir de una 
celda a otra. Por ejemplo, si se permite el movimiento en todas direcciones, la distan- 
cia desde una celda a las ocho que la rodean es igual a 1 en todos casos, pues se realiza 
en un único paso. Por similitud a la forma en que uno puede moverse en un tablero 
de ajedrez, este tipo de distancia se conoce como distancia de tablero de ajedrez 3 . 

Si, por el contrario, se permite tan solo el movimiento en dirección vertical 
y horizontal, la distancia a las celdas diagonales — por ejemplo, desde la celda 
(x,y) hasta la (x + l,y+l) — es igual a 2. En este caso tenemos la anteriormente 
mencionada distancia de Manhattan. 

En la figura 10.8 pueden verse los valores de distancia entre una celda central 
y sus circundantes según las definiciones de distancia anteriores, junto con otras 
como la distancia ortogonal o la distancia Chamfer 3-j [129]. El objetivo de estas 
distancias es mitigar en cierta medida la distorsión que se produce con las otras 
distancias ráster a medida que aumenta el alejamiento. 
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Figura 10.8: Distintos tipos de distancia ráster: a) tablero de ajedrez, b) Manhattan, 
c) ortogonal, d) Chamfer 3-4 


El análisis de costes se lleva a cabo en un SIG esencialmente en formato ráster, 
por lo que lo anterior es de importancia al respecto, y será extendido en el capítulo 
19. 

Además de hallarse las distancias entre puntos concretos, pueden calcularse 

3 Chessboard distance 
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entre geometrías. La distancia entre dos rectas en el plano es igual a la distancia 
entre un punto cualquiera de una de ellas a la otra en el caso de que sean rectas 
paralelas. Si no lo son, la distancia es nula, ya que existirá un punto en el que se 
corten. No obstante, no ha de olvidarse que en un SIG habitualmente no trabajamos 
con rectas de longitud infinita en el sentido matemático, sino con segmentos de estas. 

La distancia de un segmento definido por sus extremos (aq,yi) y (£ 2 , 2 / 2 ) a un 
punto de coordenadas (£3,2/3) se calcula como la distancia de este último hasta 
la intersección de la recta que pasa por el mismo y es perpendicular al segmento. 
Dicho punto de intersección tiene por coordenadas 


x=x 1 +u(x 2 -xi)y=yi+u(y 2 -yi) 
donde u se calcula según 

= (x 3 -xi)(x 2 -x 1 ) + (y 3 -y 1 )(y 2 -yi) 
(x 2 -x 1 ) 2 + (y 2 -y 1 ) 2 


( 10 . 3 . 4 ) 


( 10 . 3 . 5 ) 


La distancia entre un punto y un polígono es la de dicho punto a la línea que 
contiene al segmento más cercano de cuantos componen el perímetro del polígono. 

Para el caso de polígonos, dos son las magnitudes principales: área y perímetro. 
El área se calcula aplicando la fórmula 


A = 


n y 'A i!/i + 1 £¿+l2/í 


i= 1 


( 10 . 3 . 6 ) 


donde se considera que el vértice n+1 se corresponde con el primero, esto es, el 
polígono es una polilínea cerrada. 

Para aquellos polígonos que contengan «huecos», basta restar del área total 
la correspondiente a esos huecos. Esta última se calcula de igual modo, ya que los 
huecos están definidos de forma similar por un conjunto de puntos conectados. 

El perímetro de un polígono es la suma de las distancias entre vértices conse- 
cutivos, es decir, 


P = J2\/(x i+1 -Xi) 2 + (y i+ i-yi) 2 ( 10 . 3 . 7 ) 

Í= 1 

Además de los anteriores, un parámetro de interés también para polígonos es 
el centro de gravedad, cuyas coordenadas se calculan según 


C X = 

Cy = 


6 A 


J2(xiX i+ i)(xiyi +1 -Xi +1 yi) 


i — 1 


6 A 


5 ^(ym+ilizm+i-xi+m ) 


i = 1 


( 10 . 3 . 8 ) 
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La medida del área y de la longitud de un elemento lineal como el perímetro 
de un polígono o una recta, pueden llevarse a cabo para datos en formato ráster 
de una forma distinta. Para el caso del área basta contar el número de celdas del 
polígono y multiplicarlo por el área de una única celda. En el caso de la longitud, 
basta sumar la longitud total de todos los lados exteriores, esto es, de aquellos que 
no son contiguos a otra celda del polígono. Todos estos cálculos se establecen en 
función del tamaño de celda como magnitud base. Para el cálculo del centroide, 
este es el centro de masas calculado como si cada celda perteneciente al polígono 
fuese una masa puntual unitaria. 

Para concluir, un sencillo análisis entre un punto y un polígono, el cual utili- 
zaremos frecuentemente, es la comprobación de si este punto se encuentra dentro 
o fuera del polígono. Para ello existen diversas metodologías, pero la más habitual 
es la basada en el número de veces que una semirecta con origen en el punto cruza 
el borde del polígono. El algoritmo es como sigue [130]: 

■ Se traza una recta desde el punto en cuestión hasta un punto fuera del 
polígono. Lo habitual es considerar la semirecta horizontal desde el punto 
dado y bien en la dirección positiva o bien en la negativa. 

■ Se cuenta el número de veces que dicha semirecta corta la frontera del 
polígono. 

■ Si el número de cortes es par, el punto se encuentra fuera. Si es impar, el 
punto se encuentra dentro. 

En la figura 10.9 se muestra un ejemplo de lo anterior. 



1 cruce (dentro) 

2 cruces (fuera) 

3 cruces (dentro) 


Figura 10.9: Pertenencia de un punto al interior de un polígono en función del numero 
de cortes entre la frontera de dicho polígono y una semirecta con extremo en dicho punto. 

La pertenencia o no del punto al polígono queda definida así en todos los casos, 
salvo cuando el punto está en la propia frontera o bien la semirecta coincide en 
algún tramo con el contorno, en cuyo caso resulta imposible el cálculo del número 
de cortes (Figura 10.10). 

10.4. Relaciones espaciales 

Como ya sabemos, conceptos tales como la posición o el tamaño, son básicos 
para el análisis geográfico, pues derivan de la propia georreferenciación inherente 
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Figura 10.10: Problemas de la metodología para determinar si un punto se encuentra 
en el interior de un polígono cuando la semirecta coincide parcialmente con la frontera. 


a todo dato espacial. El hecho de que exista dicha referencia en el espacio es 
responsable de que los mismos valores de una variable no tengan igual significación 
en unos lugares que en otros, y que estos lugares no solo se consideren en términos 
absolutos, sino también relativos entre los distintos datos espaciales. 

La importancia de esta posición relativa ya la vimos al tratar la autocorre- 
lación espacial, ya que una misma serie de valores, si se disponen de una forma 
distinta, pueden presentar un signo distinto de autocorrelación espacial, con las 
consecuencias que ello tiene. 

Si pensamos por ejemplo en el uso de otro tipo de información geográfica tal 
como la de un callejero urbano para orientarnos en una ciudad, utilizamos ideas 
tales como «la Calle Mayor es paralela a esta avenida» o «El teatro al que me dirijo 
está detrás de ese bloque de edificios». Existe de igual modo una relación entre 
los distintos elementos, que es la que permite que podamos analizar y explotar 
la información geográfica, pues esta en gran medida no tiene sentido como una 
colección de datos aislados. 

Así pues, resulta claro que los distintos elementos con los que trabajamos 
dentro de una o varias capas de información geográfica se relacionan entre sí. Estas 
relaciones pueden obedecer a diversos criterios y son la base de un gran número de 
distintos procedimientos que las estudian y generan resultados en función de ellas. 

De entre dichas relaciones, algunas son de tipo topológico y otras se fundamen- 
tan no en la topología existente pero sí en otras propiedades de tipo espacial, por 
ejemplo propiedades métricas como la distancia. Además de lo anterior, existen 
muchos otros criterios en base a los cuales pueden clasificarse las relaciones. 

En esta sección daremos una definición formal de los principales tipos de 
relaciones y, especialmente, de los razonamientos que dan lugar a estos criterios y 
son claves para comenzar a entender el análisis espacial tal y como este se presenta 
en un SIG. De esta forma, posteriormente podremos aplicar estas relaciones con 
claridad a los distintos datos geográficos. 

[131] propone los siguientes tipos de relaciones espaciales: 

■ Relaciones direccionales, que describen el orden en el espacio. Por ejemplo, 
al norte de, al sur de, etc. 
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■ Relaciones topológicas, las cuales describen la vecindad e incidencia. Por 
ejemplo, son disjuntos o son adyacentes. 

■ Relaciones comparativas, que describen la inclusión. Por ejemplo está en. 

■ Relaciones de distancia, tales como lejos de o cerca de. 

■ Relaciones «difusas» tales como al lado de o a continuación. 

Las relaciones espaciales pueden establecerse entre todas las combinaciones 
posibles de entidades geográficas. Por nombrar algunos ejemplos, las siguientes 
cuestiones se refieren a relaciones entre objetos geográficos de diversa índole: 

■ ¿Se encuentra esta localización a menos de 100 metros en línea recta de algún 
camino? (relación entre un punto y una recta) 

■ ¿Cruza ese camino algún área protegida? (relación entre una recta y un 
polígono) 

■ ¿Cruza ese camino bajo alguna línea de alta tensión? (relación entre dos 
líneas) 

■ ¿Existe algún área urbanizada contigua a ese área protegida? (relación entre 
dos polígonos) 

Asimismo, las relaciones pueden establecerse entre elementos con un mismo 
tipo de información, o bien entre tipos distintos. Los anteriores son ejemplos de 
este último caso. Un ejemplo del primero podría ser la relación de proximidad 
entre dos emplazamiento puntuales de una misma clase (¿existe una farmacia a 
menos de un kilómetro de esta otra farmacia?). 

Dentro de un SIG, las relaciones topológicas tienen utilidad en los procesos 
de análisis implementados como tales, pero también en otras partes de un SIG 
que, constituyendo análisis propiamente dichos, quizás no se perciben como tales. 
Por ejemplo, las herramientas de selección de entidades dependen de las relaciones 
espaciales que estas presentan con el objeto empleado como criterio de selección, ya 
sea este un punto concreto que el usuario escoge con el ratón, un área rectangular 
delimitada de igual modo, o las entidades de otra capa adicional, entre otros. 

A la hora de clasificar y definir las relaciones espaciales deben considerarse 
tres enfoques principales: un enfoque netamente matemático, un enfoque psico- 
lógico y un enfoque geográfico. El enfoque matemático pretende formalizar con 
un lenguaje matemático las distintas relaciones, de forma que puedan estudiarse y 
analizarse a través de las herramientas matemáticas habituales, tanto topológicas 
como espaciales. Por su parte, el enfoque geográfico surge según se desarrollan 
los Sistemas de Información Geográfica y aparece la necesidad de expresar las 
relaciones espaciales de un modo adecuado para implementar estas, así como los 
distintos algoritmos que se sustentan en ellas. Puede entenderse en cierta forma 
como una versión práctica del enfoque matemático. 

Tanto el enfoque matemático como el geográfico son netamente cuantitativos 
pero a la hora de comunicar algún tipo de conocimiento espacial que lleve implícita 
una relación espacial, lo hacemos principalmente de forma cualitativa [132] [133]. 

Así, al indicar a otra persona si se puede llegar rápidamente a una dirección dada 
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dentro de la ciudad, no decimos «el parque al que quieres ir está contenido dentro 
de un radio de 1,2 km» sino que diremos algo como «sí, está cerca, se puede llegar 
andando». En nuestro pensamiento espacial y en el lenguaje que utilizamos para 
expresarlo, no es necesaria la precisión cuantitativa, que sin embargo sí se requiere 
para plantear otros modelos de relaciones. Entender las relaciones espaciales 
cualitativas para poder implementarlas en una herramienta lógica como un SIG es 
en esencia un problema de traducción entre un lenguaje natural y uno formal [134], 

La forma en que los SIG incluyen las relaciones espaciales para sus propósitos 
debe combinar todos estos enfoques con objeto de conseguir que el razonamiento 
espacial pueda transmitirse de forma sencilla y lo más efectiva posible. Teniendo 
en cuenta esto, autores como [135] argumentan que, en la actualidad, la falta de un 
sistema de relaciones espaciales completo que dé respuesta a todas las necesidades 
que se plantean, es uno de los principales escollos para un mayor desarrollo de la 
disciplina de los SIG. El problema, no obstante, no presenta una solución sencilla, 
ya que, como hemos visto, los criterios a aplicar pueden ser muy variados y las 
ideas matemáticas han de combinarse igualmente con los elementos perceptivos 
acerca de cómo estas relaciones se entienden y se interpretan [136]. 

Lo habitual dentro de un SIG es la conversión de los conceptos del lenguaje 
natural (cualitativos) en elementos cuantitativos, de forma que estos pueden 
después tratarse con las herramientas de algún sistema formal de relaciones. Este 
planteamiento, aunque potente, puede no ser adecuado para según qué casos. El 
futuro de los SIG pasa por ser capaz de manejar de forma integrada las relaciones 
cualitativas, de forma que se aumente la usabilidad para aquellos usuarios que no 
disponen de un conocimiento de los sistemas formales, pero pueden sin embargo 
plantear cuestiones espaciales en el lenguaje habitual. 

Es importante reseñar que las relaciones geográficas, sea cual sea el criterio 
por el que se definan, no están condicionadas de forma alguna al tipo de almacena- 
miento del dato espacial (vectorial, ráster, etc) u otras características arbitrarias 
del mismo. Son, por el contrario, conceptos puramente teóricos sobre elementos 
situados en el espacio, los cuales pueden aplicarse a cualquier objeto con indepen- 
dencia de cómo este haya sido recogido. No obstante, la forma de almacenamiento 
condiciona en cierta medida las relaciones existentes o, al menos, la forma en 
que estas relaciones se incluyen en el propio almacenamiento. Así, para el caso 
por ejemplo de una capa ráster, tenemos una estructura regular de elementos 
relacionados entre sí de tal forma que son contiguos y están a una misma distancia. 
Es decir, con una relación topológica y otra métrica que se mantienen constantes 
para todos los elementos unitarios mediante los cuales se almacena la capa. 

10.4.1. Relaciones topológicas 

Entrando en la propia definición de relaciones, el conjunto principal de estas 
es el formado por las de tipo topológico, que serán por ejemplo las que empleemos 
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para combinar las geometrías y elementos de dos capas vectoriales según cómo sean 
dichas relaciones entre ellas. De entre estas relaciones destacan los denominados 
predicados espaciales , que son operaciones de tipo lógico que nos indican si entre 
dos objetos geográficos existe o no un tipo de relación dada. Se consideran estos 
objetos en M 2 , es decir, como objetos planos. 

La definición formal de estos predicados ha sido motivo de abundante estudio 
desde la aparición de los SIG, en parte motivado por la mayor necesidad que de tal 
formalismo se tiene si se pretende estructurar adecuadamente todas las operaciones 
de análisis que un SIG puede contener. 

Uno de los sistemas iniciales de predicados es el conocido como 4~ Intersection 
[137]. Según este modelo, la relación entre dos objetos A y B queda definida por 
las intersecciones entre las fronteras (6 A y 6B) y los interiores ( A y B ) de estos. Se 
tienen así cuatro intersecciones con las que se conforma una matriz que caracteriza 
la relación existente. 


3 4 (A,£) = 


AnB AndB 
5AnB ÓAndB 


(10.4.1) 


Para cada una de las cuatro intersecciones se estudia algún invariante to- 
pológico, es decir, alguna propiedad que sea invariante a las transformaciones 
topológicas. De entre ellas, lo más habitual es emplear el contenido, esto es, si la 
región delimitada por la intersección esta vacía (0) o no (- 10 ). 

Teniendo cuatro elementos y dos posibles valores para cada uno, existen un 
total de 2 1 = 16 diferentes matrices con la forma anterior. De estas, ocho pueden 
darse en un plano entre objetos bidimensionales con fronteras cerradas, cada uno 
de los cuales define una región. Estas ocho relaciones son las mostradas en la figura 
10.11, con sus matrices características correspondientes. 
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Figura 10.11: Conjunto de relaciones posibles entre regiones según el modelo 
4-Intersection. 

Un razonamiento similar puede aplicarse al caso de líneas, cuya principal dife- 
rencia radica en que conforman elementos con fronteras no cerradas. No obstante, 
la forma de proceder y las relaciones definidas son análogas en gran medida. 

A partir del modelo 4-Intersection, Egenhofer [137] desarrolla el modelo 9- 
Intersection, en el cuál se amplia el anterior a la consideración de tres elementos 
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en lugar de dos. Además de considerar las fronteras e interiores de los objetos A 
y B, se consideran asimismo los exteriores de los mismos ( A~ y B~ ). La matriz 
característica queda entonces de la forma 





AnSB 

5AnóB 

A~n5B 


AnB- 

óAnB- 

A~nB- 


(10.4.2) 


El numero total de matrices posibles es en este caso de 2 9 = 512. De todas ellas, 
solo un pequeño subconjunto representan relaciones posibles en M 2 a las cuales 
pueda asignarse una interpretación geométrica. 

Por ejemplo, la matriz siguiente, en la que todos los elementos son el conjunto 
vacío, resulta imposible de obtener con ningún tipo de relación. 


%(A,B) = 


( 


\ 


(10.4.3) 


Dependiendo del tipo de objetos sobre el que se den las relaciones, el modelo 
9-Intersection amplía al 4~Intersection de una u otra forma. 

En el caso de dos regiones, se tienen ocho posibles relaciones, por lo cual no 
existe diferencia entre ambos modelos. 

Para el caso de dos líneas en M 2 , aparecen 25 nuevas relaciones. En caso de 
considerar líneas ramificadas (con más de dos puntos extremos), aparecen además 
21 relaciones adicionales. Por último, para el caso de una línea y una región, se tienen 
un total de 19 relaciones posibles, 20 en el caso de admitirse líneas ramificadas. 


10.4.2. índices métricos 

Pese a su aparente complejidad y completitud, el modelo 9-Intersection deja de 
lado otra serie de relaciones posibles, tales como las basadas en distancias u orien- 
taciones, las cuales son en muchos casos más cercanas al habla común y al enfoque 
perceptivo y lingüístico del razonamiento espacial. Estas relaciones pueden formal- 
mente definirse no a través de predicados como los establecidos por los modelos 
anteriores, sino cuantificándose mediante índices diversos. El uso de estos índices en- 
riquece la definición de las distintas relaciones expresadas mediante un modelo como 
el 9-Intersection^ añadiendo información acerca de la naturaleza exacta de estas. 

Por ejemplo, si dos regiones de una hectárea se intersecan, no es lo mismo 
que lo hagan dando lugar a una intersección de media hectárea que a una de 100 
metros cuadrados. Topológicamente, se trata de la misma relación, pero está claro 
que, en la práctica, las implicaciones de una u otra intersección son bien distintas. 

Dependiendo de los tipos de entidades que se consideren, existen distintos 
índices que cuantifican la relación existente. [138] propone para el caso de una 
región y una línea el análisis en términos métricos de las siguiente propiedades: 
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■ Subdivisión. Se definen índices que describen la forma en que la frontera, 
interior y exterior de la región subdivide a la frontera y el interior de la línea. 
Estos índices tratan, entre otros aspectos, la forma en que la línea divide el 
interior de la región, el exterior de esta (pudiendo generar áreas delimitadas 
por la línea y la región en el exterior de esta última), la relación entre la 
frontera de la región y la línea, o cómo el perímetro de la región puede quedar 
dividido en distintos tramos por las intersecciones con la línea. 

Por ejemplo, la relación de subdivisión del área interior ( internal areasplitting 
ratio(IAR)) se define cómo el mínimo área de las dos que quedan a cada uno 
de los lados de la línea dentro de la región, dividido por el área total de región. 

IAR =- ^ (10.4.4) 

titotal 

Para una descripción más detallada de otros índices puede consultarse la 
referencia original. 

■ Cercanía. Los índices de cercanía cuantifican el alejamiento entre partes dis- 
juntas de los objetos relacionados. Para su cálculo, se utilizan medidas de dis- 
tancia como las descritas en 10.3. Cuatro son los índices definidos, que miden 

• La distancia entre la frontera de la línea y la de la región, cuando la 
línea está en el exterior de la región. 

• La distancia entre la frontera de la línea y la de la región, cuando la 
línea está en el interior de la región. 

• La distancia del recorrido mínimo entre el interior de la línea y la frontera 
de la región si el interior de la línea está en el exterior de la región. 

• La distancia del recorrido mínimo entre el interior de la línea y la frontera 
de la región si el interior de la línea está en el interior de la región. 

Para el caso de dos líneas, [139] propone estudiar también las mismas propie- 
dades — subdivisión y cercanía — , desarrollando un planteamiento similar. [133], 
por su parte, añade elementos direccionales a las relaciones entre líneas, definiendo 
un ángulo local (el ángulo puntual en el punto de corte) y uno global (el definido 
por las direcciones globales de las líneas). Asimismo, incluye relaciones entre los 
rectángulos mínimos que engloban a las líneas, teniendo de este modo relaciones 
de área que complementan a las anteriores. 

10.4.3. Otras relaciones 

Muchas otras relaciones se pueden establecer entre elementos espaciales, si bien 
las anteriores son las principales y las que se presentan como más adecuadas para 
formalizar los análisis que dependen de ellas. No obstante, otros análisis que veremos 
más adelante implican relaciones espaciales basadas en otra serie de conceptos. 

Por ejemplo, el análisis hidrológico implica el estudio de la conectividad hidro- 
lógica entre sus elementos. Estos pueden ser celdas en una capa ráster o triángulos 


en un TIN, entre otros, y en función de los valores asociados a ellos, en particular la 
elevación, se establecen las relaciones de conectividad. Junto a las expresiones cerca, 
lejos, junto a, a la derecha u otras tantas que ya hemos visto para las relaciones 
métricas o topológicas, podemos emplear otras asociadas a estas relaciones de conec- 
tividad y decir, por ejemplo, que «el pueblo se encuentra aguas arriba de la presa». 

De un modo similar, los análisis de visibilidad establecen una relación entre 
los elementos, según estos puedan verse entre ellos o no, y el análisis de una serie 
de puntos situados sobre una red también implica una conectividad. 

Las relaciones de este tipo no conforman sistemas completos formales como las 
relaciones topológicas que se han desarrollado anteriormente, pero su importancia 
para estudios particulares debe considerarse y conocerse, entendiendo que se tratan 
igualmente de relaciones basadas en la posición espacial de los elementos. 

10.5. Resumen 

Los datos espaciales presentan particularidades que tienen una gran impor- 
tancia en los procesos de análisis. Entre estas, la existencia de una estructura, 
la presencia de efectos de borde o los efectos de escala y derivados tales como el 
denominado Problema de la Unidad de Área Modificable, son los más relevantes. 

La autocorrelación espacial es otro de los elementos que siempre deben tenerse 
en cuenta a la hora de estudiar los datos espaciales, pues condiciona los resultados 
de los análisis según sea dicha autocorrelación. 

Además de lo anterior, los distintos elementos con los que trabajamos en el 
análisis espacial se relacionan entre sí. El estudio y clasificación de dichas relaciones 
presenta alternativas diversas que tratan de recoger la totalidad de estas: relaciones 
topológicas, relaciones de distancia, relaciones de orientación, etc. A esto ha de 
sumarse la diferente naturaleza de las relaciones espaciales en el lenguaje habitual, 
que es eminentemente cualitativa en lugar de la naturaleza cuantitativa de los 
procesos que se implementan en un SIG. 

Modelizar estas relaciones de forma correcta e integrar todos los puntos de vista 
es importante para hacer de los SIG herramientas de análisis completas en las que 
puedan expresarse de forma intuitiva y coherente todas las relaciones existentes. 
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Capítulo 11 


Consultas y operaciones con bases de datos 


En este capitulo comenzaremos a estudiar las formas de análisis de los datos espaciales, 
tratando las consultas y operaciones relacionadas. Estas son operaciones sencillas que, 
sin embargo, se encuentran entre las más frecuentes en el uso habitual de los SIG, pues 
permiten explotar en primera instancia la información de las capas. 

Al concluir el capítulo, se conocerán los tipos más comunes de consultas y la forma 
de llevar estas a cabo, teniéndose así una primera herramienta para empezar a aprovechar 
los datos espaciales. 

Las consultas son un elemento habitual de las bases de datos, por lo que resulta nece- 
sario conocer con detalle todo lo relativo a estas, detallado en el capítulo 8. Cuando dichas 
bases de datos incluyen la componente espacial, hacen uso de las relaciones espaciales para 
definir relaciones entre elementos. Estas fueron descritas en el capítulo 10, cuyo estudio 
es necesario antes de abordar el del presente capítulo. 


11.1. Introducción 

El análisis más simple que podemos efectuar sobre una capa (o varias) de 
información geográfica es la simple consulta de esta. Entendemos por consulta una 
operación en la cual preguntamos a los datos geográficos algún tipo de cuestión 
simple, generalmente basada en conceptos formales sencillos. Este tipo de análisis, 
aunque no implica el uso de conceptos analíticos complejos, es uno de los elementos 
clave de los SIG, pues es parte básica del empleo diario de estos. 

En el contexto espacial, una consulta representa un uso similar al que damos 
a un mapa clásico, cuando en base a este respondemos a preguntas como ¿qué 
hay en la localización X? o ¿qué ríos pasan por la provincia Y? No obstante, no 
debemos olvidar que los datos espaciales tienen dos componentes: una espacial 
y otra temática. Preguntas como las anteriores hacen referencia a la componente 
espacial, pero igualmente pueden efectuarse consultas que se apliquen sobre la parte 
temática. Y más aún, pueden efectuarse consultas conjuntas que interroguen a los 
datos geográficos acerca de los atributos espaciales y temáticos que estos contienen. 

Las consultas se entienden en general como relativas a capas vectoriales, pues 
son dicho modelo de representación y su estructura de datos los que mejor se adap- 
tan a la forma particular de las consultas. En este capítulo veremos cómo trabajar 
mayoritariamente con datos vectoriales, aunque también se harán referencias a 
datos ráster, pues estos últimos contienen igualmente datos geográficos y pueden 
consultarse y responder a preguntas como las formuladas anteriormente. 
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En las capas vectoriales, y como vimos en los capítulos 5 y 8, la división entre la 
componente temática y espacial es más patente, existiendo incluso una división a 
nivel de archivos y de los elementos tecnológicos empleados para el trabajo con cada 
una de ellas dentro de un SIG. En el caso de las consultas, se mantiene un enfoque 
similar, y encontramos esa misma separación. Los lenguajes de consulta, que en 
breve veremos con más detalle y que resultan básicos para elaborar consultas y 
obtener resultados, han seguido una evolución paralela a la de los propios sistemas 
gestores de bases de datos en su adaptación al entorno espacial de los SIG. 

Antes de que los SIG incorporan las bases de datos como parte integrante, los 
sistemas gestores de bases de datos ya existían y tenían un cierto grado de desarro- 
llo. Precisamente, y como ya sabemos, la intención original era la de representar la 
información geográfica de acuerdo con un modelo que permitiera hacer uso de otras 
aplicaciones ya desarrolladas y de utilidad probada como eran dichos sistemas. 

Siguiendo este mismo enfoque, estudiaremos en primer lugar los conceptos 
fundamentales relativos a consultas en bases de datos, sin tratar por el momento la 
componente espacial. Posteriormente extenderemos estos conceptos para ver la ver- 
dadera potencia de estas dentro del ámbito SIG, que resulta de añadir la componente 
espacial y los conceptos sobre relaciones espaciales que vimos en el capítulo 10. 

Si el lector esta familiarizado con los conceptos relativos a bases de datos no 
espaciales y las consultas sobre estas, puede prescindir de leer la próxima sección 
y avanzar hasta la siguiente para ver directamente las particularidades del trabajo 
con bases de datos espaciales. De cualquier modo, el capítulo no pretende ser un 
manual sobre el uso de bases de datos o sus fundamentos, ya que este tema es muy 
amplio y escapa por completo al alcance de este texto. 


11.2. Consultas dentro de un SIG 

Antes de entrar en detalle en los distintos tipos de consultas y la forma de 
realizar estas, veamos qué es lo que realmente significa una consulta dentro de un 
SIG. Aunque mencionaremos algunos breves ejemplos de consultas sobre capas 
ráster, en general ya hemos dicho que estas se entienden como consultas sobre 
datos vectoriales, en los cuales la estructura propia del dato es más propicia para 
este tipo de operaciones. Así, partimos de datos vectoriales y de la presencia de 
algún Sistema Gestor de Bases de Datos o tecnología similar dentro de un SIG. 

En este contexto, una consulta no es sino una llamada a dicho sistema gestor, 
el cual devuelve como respuesta una serie de elementos tomados de la información 
contenida en la base de datos. Es decir, del total de datos obtenemos como con- 
secuencia de la consulta una parte de los mismos. La respuesta a nuestra consulta 
es un conjunto de elementos, de la misma forma que si en un mapa impreso pre- 
guntamos ¿qué hay aquí? y obtenemos como respuesta los datos correspondientes 
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al punto que señalamos. Estos datos son una fracción particular del conjunto de 
todos los contenidos en dicho mapa. 

El resultado de una consulta en un SIG generalmente es lo que conocemos 
como selección. De todos los registros de la tabla de datos, aquellos que cumplen el 
criterio indicado se marcan como seleccionados, y posteriormente pueden utilizarse 
únicamente estos como base de otro análisis, o simplemente el usuario puede ver 
cuáles han sido los seleccionados para así obtener la respuesta a su consulta. 

Como veremos más en detalle en las siguientes secciones, las consultas pueden 
hacerse solo sobre la componente temática de los datos, sobre la espacial, o sobre 
ambas. En cualquier caso, sabemos ya que estas en un SIG se hayan vinculadas, con 
lo que el resultado de la consulta afecta a ambas. La selección se hace patente sobre 
ambas componentes, con independencia de cuál de ellas haya sido la encargada de 
aplicar el criterio de selección. En el entorno habitual de un SIG, con su interfaz 
gráfica, tanto la tabla de atributos como la representación visual de la componente 
espacial se ven afectadas por la realización de una consulta. La figura 11.1 muestra 
gráficamente este hecho. 
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Figura 11.1: El resultado de una consulta temática en un SIG es una selección de 
entidades, que implica tanto a la componente temática como a la espacial de cada una 
de ellas. En ambos casos, el color amarillo indica los elementos seleccionados. 


Esta presencia gráfica es importante dentro del entorno de los SIG, tanto para 
mostrar el resultado de las consultas como para ayudar en la formulación de estas. 
En contraste con el carácter textual de una base de datos, el empleo de dichas bases 
de datos y la realización de consultas en un SIG incorpora una representación 
gráfica que resulta esencial [45] 

Junto con la selección de entidades dentro de una capa existente, una consulta 
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nos vale también para extraer información de una base de datos de acuerdo a 
nuestras necesidades, y para crear posteriormente y a partir de dicha información 
una nueva capa. Esta operación es útil cuando la base de datos de la que disponemos 
es muy voluminosa y solo resulta de interés para nuestro trabajo una parte de ella. 
Puede tratarse de una parte en el sentido espacial (la base de datos contiene datos 
a nivel mundial y se quiere trabajar a nivel estatal), en el sentido temático (la base 
de datos contiene mucha información de cada entidad y solo interesan algunos 
campos), o en una combinación de ambas. Para extraer dicha parte y trabajar 
únicamente con ella, utilizaremos una consulta. 

Así, la selección de una serie de entidades dentro de una capa o la extracción 
de dichas entidades de la base de datos para la creación de dicha capa son dos 
aplicaciones habituales de las consultas que seguidamente veremos. 


11.3. Consultas temáticas 

La componente temática del dato espacial es de por sí una fuente importante 
de información, y puede responder a consultas de todo tipo y ofrecernos resultados 
sumamente interesantes. Comencemos analizando algunas de estas consultas y 
viendo cómo, aunque se realicen en base a datos espaciales como los que utilizamos 
en un SIG, en realidad en ellas la componente espacial no se emplea. Sea por ejem- 
plo una capa con los distintos países del mundo y una serie de valores económicos 
y sociales asociados a cada uno de ellos. Consideremos las siguientes preguntas: 

■ ¿Qué países tienen un Producto Interior Bruto mayor que el de España? 

■ ¿Qué países han experimentado un crecimiento económico en el último año? 

■ ¿Cuántos países tienen más de 200 millones de habitantes? 

En todos estos casos estamos haciendo referencia a países, los cuales, como 
sabemos, estarán asociados a elementos geométricos que definan sus propiedades 
espaciales, es decir, a una componente espacial. Esta componente es la que permite 
que, además de poder plantear las consultas anteriores, podamos representar 
cada país en la pantalla y visualizarlo, o saber cuáles de ellos se encuentran en el 
hemisferio norte (esta sería una consulta espacial, de las que más adelante en este 
mismo capítulo veremos). 

Sin embargo, cuando realizamos consultas como las tres anteriores, no acudimos 
para nada a la componente espacial. Consultas como estas podrían resolverse si en 
lugar de una capa dentro de un SIG tuviéramos, por ejemplo, un simple anuario 
estadístico lleno de tablas con datos correspondientes a cada país. De hecho, antes 
del desarrollo de los SIG, ese tipo de datos, aunque referidos a elementos geográficos, 
se almacenaban en documentos tales como dicho anuario, y no específicamente en 
mapas. Es fácil encontrar mapas del mundo con meras divisiones fronterizas entre 
países (un mapa político) o quizás con elevaciones y elementos orográficos (un 
mapa físico) , pero no es tan sencillo adquirir un mapa en el que pueda conocerse 
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el crecimiento económico del ultimo año en cada país. Esta información se puede 
adquirir, sin embargo, de forma sencilla en ese anuario estadístico que citamos. 

Antes de la aparición de los SIG, la componente temática (el anuario estadístico) 
y la espacial (el mapa político) iban por separado. Hoy en día, y gracias a los SIG, po- 
demos trabajar con ellas de forma conjunta, pues es fácil ver que existe una relación 
entre ambas. No obstante, en el ámbito informático se han desarrollado tecnologías 
para trabajar con conjuntos de datos tales como las tablas de un anuario estadístico, 
pues la componente espacial no siempre existe o bien no se utiliza, y es por estas 
tecnologías por donde debemos comenzar a desarrollar todo lo relativo a consultas. 

Por un momento, dejemos de lado la componente espacial de cada país, y 
pensemos que solo conocemos de él algunas variables socio-económicas tales como 
el PIB, la población, el idioma que se habla o el nombre de su moneda, tal y como 
se recogen en la tabla de la figura 11.1 

11.3.1. Mecanismos de consulta y operaciones básicas 

Consultas como las anteriores pueden expresarse fácilmente en un idioma tal 
como el español y son de igual modo fácilmente entendibles por cualquiera que 
conozca el idioma. El problema es que el ordenador, y por tanto el Sistema de 
Información Geográfica, no entiende estas expresiones, siendo necesario formular 
las consultas de alguna forma que pueda ser interpretada correctamente por el 
SIG o el gestor de bases de datos correspondiente. 

Dentro de un SIG hay muchas formas de expresar una consulta. Una forma 
simple es a través de expresiones lógicas relativas a los campos de la tabla de 
atributos. Planteando las consultas como expresiones condicionales, la respuesta 
a estas son aquellas entidades que hacen verdadera dicha expresión. 

Para trabajar desde este punto en adelante, vamos a suponer que disponemos 
de una tabla con datos de países del mundo, la cual contiene los siguientes campos: 

■ NOMBRE 

■ CAPITAL 

. MONEDA 

■ POBLACION_ACTUAL 

. P0BLACI0N_ANTERI0R 

■ SUPERFICIE 

Por ejemplo, para saber el número de países con población mayor de 200 millo- 
nes, podríamos utilizar una expresión como la siguiente: ’ POBLACIGN_ACTUAL ) > 
200000000 . Para saber en qué países aumentó la población en el ultimo año, y pues- 
to que disponemos además de un campo con la población de año anterior, podemos 
plantear una expresión de la forma P0BLACI0N_ACTUAL >P0BLACI0N_ANTERI0R. 

Estas expresiones condicionales se conocen con el nombre de predicados. 

Los predicados no han de ser necesariamente de carácter numérico. Por ejemplo, 
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para saber qué países pertenecen a la Unión Económica Europea podríamos hacerlo 
mediante el predicado MONEDA = J Euro ’ . 

Consultas de esta índole también pueden efectuarse si los datos geográficos 
se basan en un modelo de datos ráster. En este caso, podemos de igual modo ver 
qué celdas cumplen una condición dada como, por ejemplo, tener un valor mayor 
que un valor predefinido. Sin embargo, este tipo de operaciones no se suelen ver 
habitualmente como consultas, sino como operaciones de lo que se conoce como 
álgebra de mapas, en particular una operación denominada reclasificación. Veremos 
con detalle estas operaciones en el capitulo 14, enteramente dedicado a ellas. 

Las consultas mediante expresiones condicionales pueden ser algo más com- 
plejas que lo que hemos visto hasta ahora, ya que pueden hacer referencia a varios 
campos. Por ejemplo, para responder a cuestiones como las siguientes: 

■ ¿Qué países de la zona euro tienen más de 40 millones de habitantes? 

■ ¿En qué países de habla inglesa aumentó la población durante el último año? 

Para expresar esas consultas se han de incluir elementos de la denominada 

lógica booleana 1 . Para entender de forma sencilla este concepto, podemos reescribir 
las consultas anteriores de la siguiente manera: 

■ ¿Qué países tienen como moneda el euro y a la vez tienen más de 40 millones 
de habitantes? 

■ ¿Que países hablan inglés y sufrieron un aumento de población durante el 
último año? 

La partícula y nos indica que realmente nuestra consulta se compone de dos 
condiciones. Por ejemplo, en el primero de los casos se debe cumplir la condi- 
ción Moneda = ’Euro’, y al mismo tiempo la condición P0BLACI0N_ACTUAL > 
40000000 . La sintaxis habitual para expresar esto a la hora de formular la consul- 
ta es emplear el termino inglés AND, de forma que tendríamos la expresión MONEDA 
= J Euro ’ AND P0BLACI0N_ACTUAL > 40000000. 

Otros operadores lógicos que podemos emplear son el operador disyuntivo o 
(0R) o el operador de negación (N0T). Añadiéndolos a las expresiones condicionales 
podemos crear consultas más elaboradas para extraer la información que buscamos. 
En realidad, formular una consulta de este tipo es buscar un subconjunto particular 
(el formado por las entidades que quedarán seleccionadas) dentro de un conjunto 
global (la capa geográfica). Por ello, es útil plantear estas operaciones lógicas 
desde el punto de vista de la teoría de conjuntos, y hacer uso de los denominados 
diagramas de Venn 2 , que muestran de forma gráfica y muy intuitiva el significado de 
dichas operaciones. En la figura 11.2 pueden verse los diagramas correspondientes 
a las operaciones que hemos visto hasta el momento. 

Más adelante volveremos a encontrar esquemas similares a estos, en particular 
al estudiar las operaciones de solape entre capas vectoriales, en el capítulo 18. 

denominada así por el matemático irlandés George Boole(1815, 1864) 

2 John Venn (1834, 1923), un matemático inglés, fue el primero en proponer este tipo de 
diagramas en 1880 
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Figura 11.2: Diagramas de Venn. 


Una operación muy habitual en el ámbito de las bases de datos es la unión de 
tablas. Si la componente temática en el modelo vectorial se almacena en una tabla 
de atributos, es posible, mediante esta operación, almacenar dicha componente 
en un conjunto de ellas interrelacionadas, lo cual en términos generales conlleva 
una mejor estructuración, como ya vimos en el capítulo dedicado a las bases de 
datos. En otras palabras, resulta conveniente no poner toda la información en una 
tabla, sino dividirla en un conjunto adecuadamente estructurado de tablas, que 
después pueden combinarse y utilizarse de la manera que resulte más apropiada. 

Lógicamente, si la información se encuentra disponible en una serie de tablas, 
pero las entidades geométricas que contienen la componente espacial del dato solo 
tienen asociada una de ellas, es necesario algún elemento adicional que permita rela- 
cionar a todas esas tablas. Este elemento son las operaciones de unión, que pueden 
efectuarse entre varias capas (cada una aporta su tabla de atributos) o también con 
tablas aisladas, sin necesidad de que estas tengan asociada una componente espacial. 

Veamos un ejemplo de una unión entre tablas para comprender el significado de 
esta operación. En el cuadro 11.1 se muestran dos tablas. En la primera de ellas, que 
supondremos que se encuentra asociada a una capa de polígonos, encontramos un 
valor numérico que identifica cada entidad (ID) y es distinto para cada una de ellas, y 
otro valor numérico también entero (TIPG_SUELG) que nos indica el grupo de tipo de 
suelo de dicho polígono. Es decir, es la tabla de una capa de usos de suelo. En la segun- 
da tabla, que es una tabla no asociada a ninguna capa, encontramos la equivalencia 
entre los valores de tipo de suelo y el nombre de dicho tipo de suelo (N0MBRE_SUEL0) , 
así como en el campo denominado APTITUD, que, en una escala de 1 a 10, clasifica 
la aptitud del suelo para el crecimiento de una determinada especie vegetal. 

En estas tablas existe un campo común, que es el que contiene el código numérico 
del tipo de suelo (en el ejemplo tiene el mismo nombre en ambas tablas, pero esto 
no ha de ser necesariamente así, basta con que la variable que contengan ambos 
campos sea la misma), y que podemos emplear para establecer la relación entre 
las dos tablas. Si un polígono tiene asociado un suelo de tipo 1, y gracias a la tabla 
adicional sabemos que el suelo de tipo 1 es un fluvisol y que su aptitud es 5, entonces 
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ID 

TIP0_SUEL0 

1 

3 

2 

1 

3 

3 

4 

3 

5 

2 


TIPG_SUEL0 

N0MBRE_SUEL0 

APTITUD 

1 

Fluvisol 

5 

2 

Cambisol 

7 

3 

Leptosol 

4 


Cuadro 11.1: Unas sencillas tablas para efectuar una unión en función de su campo 
común TIPO SUELO. 


ID 

TIP0_SUEL0 

N0MBRE_SUEL0 

APTITUD 

1 

3 

Leptosol 

4 

2 

1 

Fluvisol 

5 

3 

3 

Leptosol 

4 

4 

3 

Leptosol 

4 

5 

2 

Cambisol 

7 


Cuadro 11.2: Resultado de la unión de tablas en base a su campo común TIP0_SUEL0. 


podemos decir que dentro de ese polígono el suelo es de tipo fluvisol y tiene dicha 
aptitud, aunque en la tabla asociada no se encuentre directamente esta información. 
Esta forma de proceder debe ser ya familiar para el lector, pues la unión se basa en el 
uso de un atributo clave, que ya vimos en el capítulo 8 dedicado a las bases de datos. 

Al efectuar una unión, pasamos la información de una tabla a la otra, en la 
medida en que esto sea coherente con las coincidencias existentes entre ellas. El 
resultado es una nueva tabla que extiende la tabla original, incorporando infor- 
mación de otra tabla adicional. En el cuadro 11.2 puede verse la tabla resultante 
de la anterior unión 3 . 

3 Esta tabla es la resultante de uno de los tipos de unión posibles, la denominada unión natural. 
Otros tipos de unión para las mismas tablas de partida dan como resultado tablas distintas, aunque 
no se usan con tanta frecuencia. La unión cartesiana genera una tabla que contiene todas las combi- 
naciones posibles entre elementos de las dos tablas implicadas. En otros casos, la tabla generada pue- 
de contener los dos campos utilizados como enlace, uno por cada tabla de las utilizadas en la unión 
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Mantener la información dividida en varias tablas de la forma anterior tiene mu- 
chas ventajas, como ya en su momento comenzamos a ver en el apartado 8.2.6 cuan- 
do tratamos el diseño de bases de datos, y ahora al estudiar las consultas vemos plas- 
madas de modo claro una buena parte de ellas. El hecho de codificar cada nombre de 
tipo de suelo con un valor numérico hace más sencillo el introducir este parámetro, 
pues evita teclear todo el nombre cada vez que se quiera añadir algún nuevo registro 
a la tabla principal (en este caso, la que se encuentra asociada a la capa). Esto ade- 
más disminuye la probabilidad de que se cometan errores al introducir dichos valores 
y garantiza la homogeneidad de nombre, pues estos solo se encuentran almacenados 
una única vez en la tabla adicional. Las restantes tablas se alimentan de esta. 

Las ventajas son mayores si se piensa que la tabla que caracteriza cada tipo de 
suelo puede estar unida no a una sola tabla de atributos, sino a un número mayor 
de ellas. En tal caso, ampliar o modificar la información de las tablas resulta mucho 
más sencillo, pues solo se deben efectuar dicha ampliación o modificación sobre la 
tabla de la que las demás toman sus datos. Si por ejemplo quisiéramos modificar 
la aptitud del tipo de suelo leptosol de 4 a 5, basta realizar esta modificación en 
la tabla auxiliar. El número de veces que este tipo de suelo aparece en la tabla 
de atributos de la capa resulta indiferente a la hora de efectuar esta modificación, 
pues solo ha de cambiarse una vez. 

Si se desean añadir nuevos campos tales como el nombre del tipo de suelo en 
un idioma distinto o la aptitud de cada tipo de suelo para una especie distinta, 
estos no han de añadirse a cada tabla de atributos, sino solo a la tabla auxiliar. Por 
otra parte, el almacenamiento estructurado tiene como resultado una información 
menos redundante, y por tanto un menor volumen de los datos. En definitiva, 
existen muchas ventajas asociadas a una estructuración adecuada de los datos, 
las cuales pueden aprovecharse definiendo las relaciones entre todas esas tablas 
a través de operaciones tales como la unión. 

Todas las operaciones que hemos visto se realizan de forma diferente según el SIG 
que empleemos, pues constituyen herramientas independientes que se implementan 
de una u otra forma dependiendo del producto. Existe, no obstante, una forma uni- 
ficada de llamar a estas y a otras funciones, y es a través de los lenguajes de consulta. 
Los lenguajes de consulta son un elemento fundamental de las bases de datos y, bási- 
camente, y como su nombre indica, se trata de lenguajes pensados para poder expre- 
sar todo tipo de consultas relativas a una base de datos y obtener así una información 
dada a partir de ella. Es decir, permiten expresar todas las consultas que hasta el 
momento hemos visto en este capítulo, así como otras más complejas y elaboradas. 

En realidad, son lenguajes que buscan dar solución a todas las necesidades 
de trabajo con bases de datos, y estas incluyen no solo aquellas relacionadas con 
consultas (aunque representen la operación más habitual) sino también las que 
derivan del mantenimiento y creación de dicha base de datos. En su empleo más 
habitual, los lenguajes de consulta han de ofrecer una forma sencilla y eficaz 
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de que un usuario cualquiera pueda efectuar consultas sobre una base de datos, 
formulando estas de una forma lógica y flexible. 

Un lenguaje de consulta posee una sintaxis rígida, que lo asemeja a un lenguaje 
de programación (de hecho, se trata de un lenguaje de programación como tal). No 
obstante, la complejidad algorítmica inherente a la propia consulta queda oculta en 
la expresión, asemejándose en ese sentido más a un lenguaje natural. Un lenguaje 
de consulta no sirve para implementar algoritmos, sino que expresa de una forma 
más natural (aunque con una sintaxis adecuada al entorno computacional en que 
se encuentra) dichos algoritmos de consulta. 

Dicho de otro modo, estos lenguajes de consulta van a expresar en lineas gene- 
rales qué es lo que se quiere hacer, pero no cómo se debe hacer, al contrario que los 
lenguajes de programación (tales como los que se emplean para programar, por ejem- 
plo, un SIG), que permiten describir formalmente algoritmos y procedimientos 4 . 

El siguiente paso es, pues, estudiar cómo los lenguajes de consulta se incorpo- 
ran a un SIG y la forma de utilizar estos. El lenguaje de consulta más extendido 
para bases de datos relaciónales, tanto dentro como fuera del ámbito SIG, es el 
denominado SQL (acrónimo de Structured Query Language o Lenguaje de Consulta 
Estructurado) . 

11.3.2. El lenguaje SQL 

El lenguaje SQL es un lenguaje de consulta pensado para el manejo de datos, 
e incluye elementos para realizar todas aquellas operaciones habituales que se 
presentan en el uso de una base de datos. Su utilización es habitual dentro de 
cualquier sistema que implique el manejo de datos mediante un gestor de bases de 
datos, y un cierto conocimiento de sus fundamentos es de indudable interés para 
el usuario de SIG. El objetivo de esta parte no es constituir una referencia de este 
lenguaje, sino tan solo presentar sus principales elementos para mostrar la forma 
en que un lenguaje de consulta soluciona las necesidades que operaciones como las 
vistas hasta este punto plantean dentro de un SIG. Las referencias sobre SQL son 
muy abundantes y el lector interesado no tendrá dificultad en encontrar docenas de 
libros sobre este tema. Una referencia completa es [140]. Más fácilmente accesible, 
en la dirección Web [141] puede encontrarse una breve introducción en español 
al lenguaje SQL, disponible además bajo licencia libre. 

Podemos distinguir tres componente principales dentro del SQL: 

■ Un lenguaje de definición de datos. Mediante él podemos definir las carac- 
terísticas fundamentales de los datos y sus relaciones. 

■ Un lenguaje de manipulación de datos. Permite añadir o modificar registros a 
las tablas de la base de datos. Las funciones de consulta también se incluyen 
dentro de este lenguaje 

4 Los lenguajes de programación se dice que son lenguajes procedurales, mientras que los 
lenguajes de consulta se denominan no procedurales 
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■ Un lenguaje de control de datos. Sus comandos permiten controlar aspectos 
como el acceso a los datos por parte de los distintos usuarios, así como otras 
tareas administrativas 

En principio, es la segunda componente — el lenguaje de manipulación de 
datos — la que resulta aquí de mayor interés, y a la que acudiremos de forma más 
frecuente, pues contiene los elementos de consulta. 

La forma en que se realizan consultas a una base de datos empleando el lenguaje 
SQL es a través de sentencias en dicho lenguaje. Una sentencia SQL de consulta 
tendrá habitualmente una forma como la siguiente: 

SELECT lista_de_columnas 
FRGM nombre_de_tabla 
WHERE expresión_condicional 

Lista_de_columnas es una lista con los nombres de los campos que nos interesa 
incluir en la tabla resultante de la consulta, nombre_de_tabla es el nombre que 
identifica la tabla de la que queremos tomar los datos, y expresión_condicional 
un predicado que establece la condición que han de cumplir los registros a tomar. 

Como vemos, no es muy distinto de lo que hemos visto hasta ahora, y simple- 
mente es otra forma de plantear consultas, de modo similar a lo que conocemos. 
La flexibilidad del lenguaje y la adición de funciones y nuevas ordenes permiten, 
no obstante, expresar prácticamente cualquier consulta, por compleja que esta 
sea, y extraer todo el potencial de la base de datos. 

Sin animo de resultar un repaso exhaustivo a todos los elementos del lenguaje 
(ello requeriría mucha más extensión que todo este capítulo), a continuación se 
muestran algunos ejemplos de expresiones SQL explicados después en lenguaje 
natural, para dar una idea de la forma y capacidades del lenguaje. Una vez más, 
se anima al lector interesado a consultar las referencias propuestas para mayores 
detalles. Para estos ejemplos utilizaremos la tabla de países cuya estructura ya 
hemos introducido al comienzo de este capítulo. 

SELECT * 

FRGM Países 

WHERE Moneda = ’Euro’ AND Poblacion_actual > 40000000 

Esta consulta recupera todos aquellos registros en los que la población actual 
supera los 40 millones y la moneda es el euro. El asterisco indica que, para cada 
uno de estos registros, deben recuperarse todos los campos existentes. Se podría 
formar una nueva tabla solo con los nombres de los países que cumplen la condición 
establecida, mediante la siguiente sentencia: 

SELECT Nombre 
FR0M Países 

WHERE Moneda = ’Euro’ AND Población actual > 40000000 
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Las consultas pueden ser mucho más complejas, y las sentencias SELECT pueden 
usarse como parámetros dentro de un predicado lógico. Por ejemplo, supongamos 
que disponemos de una tabla denominada Capitales con datos de todas las 
capitales del mundo, y que cuenta con los siguientes campos: 

■ NOMBRE 

■ P0BLACI0N_H0MBRES 

■ POBLACION_MUJERES 

La sentencia siguiente recupera en una nueva tabla todos los países cuyas 
capitales tienen una población de hombres mayor que de mujeres. 

SELECT Nombre 
FROM Países 

WHERE Capital IN (SELECT Nombre FROM Capitales 
WHERE Poblacion_hombres > Poblacion_mujeres) 

La subconsulta entre paréntesis crea una tabla con los nombres de las capitales 
que cumplen la condición relativa a las poblaciones de hombres y mujeres. La otra 
consulta selecciona los países cuya capital aparece en dicha tabla (esa inclusión 
la define el comando IN). En conjunto, tenemos una única consulta, pero que se 
basa en dos tablas con una relación entre sí. 

Los campos Capital en la tabla Países y Nombre en la tabla Capitales son 
los que establecen la relación entre ambas tablas, permitiendo unir la información 
de estas. No obstante, el resultado de la expresión anterior no es una unión tal y 
como la hemos visto. Para realizar una unión mediante SQL podemos utilizar una 
expresión como la siguiente: 

SELECT * 

FROM Países, Capitales 

WHERE Países . Capital = Capitales . Nombre 

Como se dijo, las uniones no se limitan un tipo particular de unión como el 
que vimos. SQL incluye el comando JOIN, el cual permite trabajar con todo ese 
abanico de distintas uniones. 

Además de lo anterior, pueden emplearse operadores para que la tabla que 
constituye la respuesta a la consulta contenga campos adicionales calculados en 
función de los existentes en la tabla origen. Por ejemplo: 

SELECT Nombre, Población / Area AS Densidad 

FROM Países 

WHERE Moneda = ’Euro’ 

Esta consulta recupera todos los países donde la moneda utilizada es el Euro, 
y para cada uno de ellos define dos atributos: el nombre (directamente obtenido 
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de la propia tabla de países) y la densidad (en un campo denominado DENSIDAD, 
calculado como el cociente entre la población y el área) . 

En resumen, el lenguaje SQL permite expresar todo tipo de consultas y hacerlo 
de forma sistemática y relativamente sencilla, de una forma bastante similar a 
como lo haríamos en un lenguaje natural. 


11.4. Consultas espaciales 

Ahora que ya sabemos cómo sacar partido de los atributos (es decir, la com- 
ponente temática) , es hora de incorporar la componente espacial que se asocia a 
estos. A las consultas que pusimos como ejemplo en la sección anterior, podemos 
añadir otras como las siguientes: 

■ ¿Qué países comparten frontera con Alemania? 

■ ¿Cuántos países se encuentran completamente en el hemisferio sur? 

■ ¿Qué países están a menos de 2000 km de España? 

Para dar respuesta a esas cuestiones, basta analizar la componente espacial 
y no necesitamos para nada los datos con los que hemos trabajado anteriormente. 
Son consultas puramente espaciales. Aunque estas consultas amplían lo que ya 
conocemos, en realidad no abren ninguna nueva vía de estudio de los datos geo- 
gráficos. Son consultas a las que podríamos responder utilizando un mero mapa 
impreso, sin aprovechar el hecho de que, como hemos visto, dentro de un SIG las 
componentes espacial y temática se hallan íntimamente vinculadas. La verdadera 
potencia de las consultas espaciales la encontramos en la combinación de estas 
consultas sobre la componente espacial y las que vimos anteriormente sobre la 
componente temática. Así, se pueden plantear, por ejemplo, cuestiones como: 

■ ¿Qué países del hemisferio norte tiene una densidad de población mayor que 
la de Perú? 

■ ¿Cuántos países con más de 10 millones de habitantes se encuentran a menos 
de 1000 km de la frontera de Rusia? 

Estas consultas incorporan elementos que hacen necesario acudir a la tabla 
de atributos, y otros que requieren analizar la componente espacial, estudiando 
las relaciones espaciales y topológicas de las geometrías asociadas. 

Los lenguajes de consulta pensados para el trabajo exclusivo con datos no 
espaciales no permiten formular consultas que incorporen elementos espaciales, y 
por lo tanto no resultan suficientes para expresar las anteriores cuestiones. Tanto 
las bases de datos como los lenguajes de consulta son válidos para analizar la 
componente temática, pero no para el análisis global de ambas componentes tal 
y como este ha de llevarse a cabo dentro de un SIG, por lo que es necesario añadir 
elementos adicionales. 

No obstante, no es solo mediante un lenguaje de consulta como podemos 
plantear dichas consultas espaciales a través de un SIG. Al igual que en el caso 
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de la componente temática, a la hora de efectuar consultas sobre la componente 
espacial o bien sobre ambas conjuntamente, existen diversas formas de plantear 
dichas consultas, algunas de ellas mucho más inmediatas y sencillas. En el caso 
particular de la componente espacial, y por la propia naturaleza de esta, que puede 
ser representada gráficamente, la forma más simple de efectuar una consulta es, 
precisamente, de forma gráfica. 

Este es el mismo mecanismo que emplearíamos a la hora de trabajar con un 
mapa impreso clásico. Si señalamos sobre nuestro mapamundi y preguntamos ¿qué 
país es este?, estamos estableciendo física y visualmente el criterio de consulta 
con nuestro propio dedo. Dentro de un SIG, podemos hacer clic con el ratón 
(nuestro dedo dentro de dicho SIG) en un determinado punto de la representación 
en pantalla de una capa geográfica, y realmente estamos diciendo: ¿qué entidad 
de la capa es la que hay aquí ? o ¿qué entidad es esta? 

Al hacer esto, estamos empleando las relaciones espaciales que veíamos en el 
capítulo 10, y en particular en este caso la inclusión de un punto dentro de un 
polígono. Al efectuar la consulta, el SIG comprueba si el punto definido por nuestro 
clic de ratón se encuentra dentro de los polígonos que representan cada país. Si 
eso es así, el país en cuestión queda seleccionado. 

Una vez más, no debe pensarse que esta consulta puntual es exclusiva de los 
datos vectoriales. Podemos igualmente ir a una localización dada y preguntar por 
lo que hay en dicha localización con independencia del modelo de datos. Una capa 
ráster nos devolverá sencillamente el valor en la celda que cae en el emplazamiento 
señalado. Si la capa posee varias bandas, tal como una imagen multiespectral, nos 
devolverá un vector de valores correspondientes a los valores de todas las bandas 
en dicho punto. 

Como veremos en el capítulo 23 dedicado a servicios remotos, algunos de 
estos servicios nos permiten realizar consultas igualmente sobre datos ráster y 
coberturas. En cada punto de la cobertura tenemos una información compleja, 
que podemos recuperar del mismo modo que para otro tipo de capas, sin más que 
preguntar a dicha cobertura acerca los datos correspondientes a un punto dado. 

La consulta sobre capas no vectoriales es, sin embargo, menos interesante, pues 
el mayor interés aparece cuando consideramos entidades en el modelo geográfico 
y efectuamos consultas sobre las propiedades espaciales de dichas entidades. El 
modelo vectorial es el mejor adaptado a las consultas, no solo cuando trabajamos 
con la componente temática, como ya vimos, sino igualmente cuando se trata de 
consultas puramente espaciales. 

La consulta sobre un punto concreto que hemos descrito la incorporan la gran 
mayoría de los SIG y es una herramienta de primer orden, sumamente sencilla, que 
nos permite hacer un uso simple aunque muy práctico de los datos geográficos. No 
obstante, una consulta espacial de este tipo puede ser más compleja e incorporar 
en el criterio algo más que un único punto. Por ejemplo, podemos seleccionar 
todas las entidades dentro de un área rectangular, o bien dentro de un polígono 
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cualquiera que podríamos definir directamente sobre la propia representación en 
pantalla (Figura 11.3). 




Figura 11.3: Consulta mediante rectángulo. Los países que intersecan con los limites 
definidos por dicho rectángulo quedan seleccionados. 

Las relaciones que utilizamos en este caso ya no son entre punto y polígono, 
sino entre polígonos. La selección puede incluir tanto los países que se encuentran 
por completo contenidos dentro del polígono, como aquellos que intersecan con 
este. Es decir, que podemos aplicar varias de las relaciones que en su momento 
estudiamos entre dos polígonos. 

Además de poder efectuar estas consultas con un elemento tal como un punto 
o un polígono, también podemos valernos de otra capa son sus propias geometrías. 
Por ejemplo, si disponemos del contorno del continente europeo, podemos consultar 
la capa de países del mundo y ver cuáles se encuentran en Europa. O una capa de ríos 
del mundo nos valdría para responder a la pregunta ¿qué países atraviesa el Nilo? 

Las relaciones espaciales entre las entidades de varias capas pueden emplearse 
para efectuar una selección, pero también para otra de las operaciones importan- 
tes que veíamos en el caso de la componente temática: la unión. En aquel caso, 
se establecían las relaciones entre tablas de acuerdo a un predicado relativo a 
la propia información de las tablas (en la mayoría de los casos, que los valores 
de dos campos, uno en cada tabla, fueran coincidentes). La incorporación de la 
componente espacial implica la aparición de predicados espaciales, y estos pueden 
emplearse del mismo modo que los no espaciales para definir un criterio de unión. 

Un ejemplo muy sencillo de unión espacial es el que encontramos si combinamos 
la capa de países del mundo que venimos utilizando con una capa de ciudades 
del mundo. Podemos unir a la tabla de esta segunda capa todos los valores que 
caracterizan al país al que pertenece cada ciudad. Si existe un campo común entre 
ambas tablas de atributos (por ejemplo, el nombre del país), esto serviría para 
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efectuar esta unión. No obstante, esto no es necesario, ya que existe otro elemento 
común que no se encuentra almacenado dentro de la tabla, pero que puede tomarse 
de la componente espacial: toda ciudad debe estar situada dentro de los límites 
del país al que pertenece. Esto sirve para establecer la relación entre las tablas, 
y cada ciudad debe relacionarse con aquella entidad dentro de cuya geometría se 
encuentre el punto que la representa. 

De modo similar a como ocurría con las operaciones temáticas, todas estas 
operaciones pueden llevarse a cabo en un SIG mediante herramientas sencillas 
que se encargan de efectuar las selecciones o uniones, utilizando tanto elementos 
gráficos como textuales. Disponemos así de herramientas de consulta temática 
y herramientas de consulta espacial, ambas como utilidades independientes. Po- 
demos, no obstante, dotar de mayor potencia a las realización de consultas si 
combinamos ambas componentes del dato geográfico. 

Es en este punto donde los lenguajes de consulta que ya hemos visto hacen su 
aparición. Estos lenguajes han demostrado ser idóneos para el manejo de las bases 
de datos, y resulta lógico pensar en ellos como base para un lenguaje más potente 
que permita incorporar la componente espacial a las consultas. Tenemos de este 
modo los lenguajes de consulta espacial 

11.4.1. Lenguajes de consulta espacial 

Los lenguajes de consulta espacial son la extensión lógica de los lenguajes de 
consulta con objeto de adaptarse al manejo de datos espaciales. Del mismo que 
las bases de datos han de adaptarse para almacenar los datos espaciales, como 
ya vimos en el capítulo dedicado a estas, los lenguajes de consulta deben hacer lo 
propio para ser capaces de recoger aquellas consultas que hagan un uso explícito 
de las propiedades espaciales de los objetos almacenados. 

El lenguaje SQL que ya conocemos no resulta suficiente para expresar algunas 
de las consultas presentadas en el apartado anterior, pero sin embargo sigue siendo 
de utilidad para consultas no espaciales. Las extensiones al lenguaje SQL constitu- 
yen la forma más inmediata de obtener un lenguaje de consulta espacial adecuado 
para un uso completo, pues combinarán nuevas capacidades de consulta espacial 
con aquellas de tipo no espacial del lenguaje SQL, probadamente robustas. 

Un primera solución aparece con la revisión del lenguaje SQL llevada a cabo en 
1999 (conocida como SQL: 1999 o SQL3), en la cual se permite la creación de tipos 
personalizados de datos. Frente a los tipos originales tales como enteros, cadenas 
o valores booleanos, todos ellos poco adecuados para almacenar objetos espaciales, 
existe ahora la posibilidad de crear tipos más acordes con la naturaleza espacial de 
la información almacenada. SQL3 está orientado a objetos, y cada tipo puede tener 
una serie de métodos asociados, lo cual facilita la realización de consultas complejas. 

El problema radica en que la propia flexibilidad de este mecanismo no favo- 
rece la unicidad necesaria para la interoperabilidad de los datos. Un mismo tipo 
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puede implementarse como tipo SQL de muchas formas distintas, no siendo estas 
compatibles entre sí. Es ahí donde hacen su aparición los estándares, los cuales 
veremos con más detalle en el capítulo 32. 

De especial importancia en este sentido es la norma denominada Simple Features 
for SQL, que especifica cómo han de implementarse los tipos SQL correspondientes 
a los objetos espaciales, con objeto de estandarizar esta implementación. Así, 
una base de datos incorporará dichos tipos en sus modelos y estos podrán ser 
posteriormente utilizados para la realización de consultas SQL. En el ya citado 
capítulo 32 explicaremos en detalle este y otros estándares. 

El aspecto más importante para el contenido de este apartado no es, no obstan- 
te, el modelo de datos u otras características de la base de datos en sí (vimos esto 
ya con más detalle en el capítulo 8), sino la forma en que esto afecta a la realización 
de consultas. Por ello, la parte de mayor interés son los métodos que esos tipos 
implementan, y que pueden emplearse para dar forma a consultas espaciales como 
las que veíamos en el apartado previo. 

Estos métodos vienen también especificados por la norma Simple Features, y 
como ya veremos podemos dividirlos en tres grupos: funciones básicas, operaciones 
topológicas y de conjunto, y operaciones de análisis espacial. Los resultados que 
arrojan estos métodos se pueden emplear para dar forma a consultas que reali- 
zan operaciones como la selección o la unión. Ya vimos cómo llevar estas a cabo 
mediante consultas SQL, y los ejemplos con contenido espacial del apartado son 
también operaciones de este tipo, bien sean consultas o uniones. Veamos, pues, 
cómo podrían realizarse mediante consultas SQL empleando los métodos que han 
de presentar los tipos que cumplen la especificación Simple Features. 

Por ejemplo, para ver que países son atravesados por el río Nilo, podemos 
emplear una consulta como la siguiente: 

SELECT Países. Nombre, 

FROM Ríos, Países 

WHERE Cross (Ríos . shape , Países . Shape) 

AND Ríos. Nombre = 'Nilo’ 

La expresión Cross (Ríos . Shape , Países . Shape) hace uso del método Cross, 
que devuelve 1 en caso de que las dos geometrías pasadas como parámetros se 
intersequen, y 0 en caso contrario. Este se utiliza para realizar la selección solo 
sobre aquellas que cumplan la condición de ser cortadas por una geometría dada, 
en este caso la del río Nilo. 

La relación espacial entre el río y los distintos países no puede evaluarse ha- 
ciendo uso de SQL sin extensiones espaciales, puesto que la información sobre 
dicha relación no reside en la tabla de atributos, que es el conjunto de datos con 
el que trabaja el lenguaje SQL para realizar consultas. La información reside en 
las geometrías asociadas, y acceder a la información de estas requiere utilizar los 
métodos correspondientes a los distintos tipos espaciales. 
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Algunos métodos como el método Cross anterior expresan condiciones, y al ser 
estas evaluadas devuelven valores 1 o 0 (verdadero/falso). Los métodos existentes, 
no obstante, permiten también calcular nuevos parámetros, superando así la mera 
consulta y pudiendo obtenerse resultados con información adicional extraído de 
las propias geometrías. 

Un ejemplo de esto es el método Length, que devuelve un valor numérico corres- 
pondiente a la longitud de una línea. Si se combina con el método Intersection, 
que devuelve una nueva geometría a partir de la intersección de otras dos, podemos 
resolver la consulta anterior pero añadiendo en la tabla resultado no solo el nombre 
de los países que son atravesados por el Nilo, sino también la distancia que este 
río recorre a través de cada uno de ellos. 

La consulta tendría en este caso una forma como la siguiente: 

SELECT Países . Nombre , 

Length(Intersection( 

Ríos. Shape, Países . Shape) ) 

AS ’ Longitud’ 

FRGM Ríos, Países 

WHERE Cross (Ríos . Shape , Países . Shape) 

AND Ríos. Nombre = ’Nilo’ 

Al igual que en el apartado anterior, el objetivo de este apartado no es mostrar 
con detalle la sintaxis del lenguaje SQL cuando este se emplea para la realización de 
consultas espaciales. Los anteriores son únicamente algunos ejemplos para poner 
de manifiesto la potencia de este planteamiento y mostrar cómo los elementos espa- 
ciales se integran en el lenguaje SQL. Puede encontrarse más información en [142], 

Además de esta extensión a SQL, existen otras propuestas propuestas alter- 
nativas tales como Geo-SQL[143], SSQL (Spatial SQL)[144]o SQL-MM. 

11.4.2. índices espaciales 

Si realizamos una consulta a una base de datos, el resultado es un subconjunto 
de esta con los elementos que cumplen el criterio expresado en la consulta. Si se 
implementa de forma directa dicha consulta, esta operación implica comprobar 
todos los elementos de la base de datos y ver cuáles son los que cumplen con el 
citado criterio. Teniendo en cuenta que una base de datos puede tener un gran 
tamaño, esta forma de proceder no es la óptima. 

Veamos un ejemplo para poder entender mejor esto. Supongamos que tenemos 
una guía telefónica, que no es sino una base de datos en la que cada registro 
contiene dos campos: nombre y apellidos, y teléfono. ¿Cómo buscaríamos en esa 
guía telefónica el numero de una persona llamada Juan Pérez? Sin duda, leyendo 
uno por uno todos los nombres acabaríamos encontrando el que buscamos y su 
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número correspondiente, pero antes tendríamos que leer una gran cantidad de 
nombres y apellidos (más aún en este caso, considerando que la letra P se encuentra 
en la mitad final del alfabeto), con lo que no resulta una opción muy lógica. En 
tal caso, una guía telefónica sería una herramienta inútil. 

Sin embargo, habitualmente consultamos guias telefónicas sin problemas y 
encontramos rápidamente el teléfono de una persona sin necesidad de leer más que 
unos pocos nombres. Esto es así porque sabemos cómo están dispuestos los datos 
y buscando en el índice sabemos incluso en qué página comienzan los apellidos con 
una letra dada (en este caso la letra P). El uso de este índice nos permite optimizar 
el proceso de búsqueda de una forma realmente radical. 

Al utilizar una base de datos, si no disponemos de un índice deberemos recorrer 
toda ella para dar respuesta a nuestras consultas. No sabemos dónde buscar las res- 
puestas a nuestras consultas, del mismo modo que si en una guia telefónica no supié- 
ramos que carece de sentido buscar en la letra F el número telefónico del señor Pérez. 

Los índices nos permiten alcanzar los elementos que constituyen la respuesta 
a nuestra consulta, haciéndolo de la forma más rápida y llegando hasta ellos sin 
tener que pasar por todos los restantes. 

Describir los índices empleados en bases de datos no espaciales requiere des- 
cribir asimismo estructuras de datos complejas que escapan del alcance de este 
texto (los denominados árboles B+ son las estructuras utilizadas con más frecuen- 
cia para esta tarea) 5 . Por esta razón, no se detallarán en este capítulo más allá 
de la anterior descripción básica, pudiéndose encontrar más información en las 
referencias proporcionadas a lo largo del capítulo. 

Más interesantes que estos índices nos resultan aquellos que se utilizan en 
las bases de datos espaciales, que denominamos índices espaciales. El concepto 
es similar al de índices de bases de datos no espaciales: elementos que permiten 
optimizar las consultas mediante una correcta estructuración de los datos, en 
particular en este caso de su componente espacial. 

Los índices espaciales no deben resultarnos desconocidos, ya que los vimos 
en el capítulo 5, estudiando en su momento los tipos existentes y su proceso de 
creación. Ahora en este capítulo veremos el verdadero uso práctico de estos, y así 
podremos comprender mejor la necesidad de su existencia. 

Puede entenderse igualmente la idea de un índice espacial mediante un sencillo 
ejemplo de cómo empleamos ideas parecidas a los índices espaciales de forma 
natural cuando tratamos de resolver una consulta espacial sin la ayuda de un SIG. 
Supongamos que tenemos nuestro mapa de países del mundo y queremos averiguar 
qué países tienen su frontera a menos de 3000 kilómetros de la frontera de España. 
¿Cómo operaríamos de manera natural para dar respuesta a esta consulta? 

La solución más inmediata es medir la distancia entre España y todos los 

5 Para el lector interesado, puede encontrarse este tema tratado con mayor profundidad en, 
por ejemplo, [145]. La descripción original de los árboles B+ aparece en [146] 
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países restantes, y después tomar aquellos que hayan arrojado un resultado de 
distancia menor a 3000. La operación daría el resultado esperado, pero implicaría 
un gran número de mediciones, y no sería una forma óptima de operar. De hecho, 
es probable que a nadie se le ocurriese operar de esta forma en ningún caso. Por 
ejemplo, lo más probable es que no efectuemos mediciones con los países de Amé- 
rica, pues un conocimiento básico de geografía basta para saber que todos ellos se 
encuentran a más de 3000 kilómetros. No sabemos exactamente a qué distancia se 
encuentran, pero sabemos que de ningún modo van a cumplir el criterio establecido 
en la consulta. De modo similar podemos eliminar Australia y gran parte de Asia, 
porque se encuentran en una situación similar. 

Ese conocimiento básico de geografía que tenemos es en realidad una especie de 
índice espacial. No sirve para saber las distancias exactas ni resolver la consulta por 
completo, pero sirve para dar una aproximación y facilitar el trabajo. Descartamos 
un buen numero de países de forma casi inmediata, y luego solo realizamos las 
operaciones costosas (la medición) con un subconjunto del total. En nuestra mente, 
tenemos el conocimiento estructurado a distintos niveles. Incluso si memorizamos 
todas esa distancias, existe otro nivel más general de conocimiento, a otra escala, 
siendo este el que nos indica de forma rápida que toda América está fuera de 
la distancia establecida en la consulta y no merece la pena efectuar mediciones 
referidas a países de ese continente 

Con la utilización un índice espacial, el proceso de consulta espacial se compone 
de dos subprocesos: filtrado y refinamiento [147]. En el proceso de filtrado se hace 
una primera selección aproximada de entidades, las cuales son candidatas a cumplir 
los criterios de la consulta. Se reduce de este modo el número de elementos sobre 
los que se ha de trabajar, y esta reducción, apoyada en los índices espaciales, tiene 
un coste operacional menor que aplicar la consulta en sí a todos los elementos. 

En el refinamiento, se toman los elementos que han superado la fase de filtrado, 
y sobre ellos se aplica la consulta como tal. Esto tendrá como consecuencia que 
algunos de estos elementos, pese a haber pasado la primera fase de filtrado, no 
cumplan el criterio de la consulta, ya que este filtrado era una aproximación al 
resultado final. De esta forma refinamos este resultado previo y obtenemos ya la 
respuesta exacta a la consulta formulada. 

En resumen, se puede decir que los índices espaciales nos permiten obtener 
resultados en un área concreta sin necesidad de analizar todo el espacio ocupado 
por el total de los datos. Estos índices espaciales no son exclusivos del trabajo 
con bases de datos y la realización de consultas espaciales, sino que se encuentran 
implícitos en muchas operaciones que vamos a ver en los próximos capítulos dentro 
de esta parte del libro. Estas operaciones en realidad necesitan para su desarrollo 
efectuar algún tipo de consulta, y dicha consulta depende de los índices espaciales 
para ejecutarse con un buen rendimiento. 

Por ejemplo, las funciones de interpolación, que veremos en el capítulo 13, para 
calcular el valor en una coordenada concreta, y a partir de los valores de una capa 
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de puntos, habitualmente utilizan los n puntos más cercanos a dicha coordenada. 
Para saber cuáles son estos n puntos, podrían calcularse las distancias desde todos 
los puntos de la capa hasta la coordenada en cuestión, y después tomar los n para 
los cuales esa distancia es menor. Esta forma de proceder, sin embargo, requiere 
un número de cálculos demasiado elevado, que haría imposible ejecutar en un 
tiempo lógico dichos algoritmos de interpolación cuando los puntos de la capa sean 
numerosos (lo cual es muy frecuente) . 

Si vemos la figura 11.4, para calcular cuales son los diez puntos (en negro) más 
cercanos a una coordenada dada (en rojo), no mediríamos las distancias de todos 
ellos. Mirando a simple vista podemos estimar que esos puntos van a estar dentro 
de un círculo aproximadamente como el representado en la figura, y podemos 
prescindir de los restantes a la hora de calcular las distancias exactas. Dentro de 
ese circulo hay más de diez puntos, con lo cual debe refinarse ese resultado antes 
de poder ofrecer una respuesta exacta a la consulta. 


• 

Figura 11.4: Para calcular los diez puntos más cercanos a una coordenada dada (en 
rojo), nuestra intuición espacial nos ayuda a decidir que estos se han de buscar en un 
subconjunto reducido tal como el de los situados dentro del circulo azul de la figura. Este 
proceso de filtrado y refinamiento ahorra operaciones, y es el fundamento conceptual 
de los índices espaciales. 

Otros procesos en los que son vitales los índices espaciales son las operaciones 
de solape entre capas de polígonos, que veremos en el capítulo 18. Sin ellos, el 
rendimiento de estas operaciones espaciales sería mucho menor o incluso, como 
en el caso de la interpolación, totalmente insuficiente para que tales operaciones 
se puedan aplicar en la mayoría de los casos. 



11.5. Resumen 

Las consultas son uno de los análisis fundamentales dentro de un SIG. Bási- 
camente, una consulta efectúa una pregunta acerca de la información contenida 
en una capa, y obtiene como resultado los elementos de la capa que dan respuesta 
a dicha pregunta. Las consultas son en general un elemento aplicado sobre capas 


vectoriales, y el resultado de la consulta se expresa mediante una selección de 
entidades dentro de aquellas que componen dicha capa. 

Las consultas pueden efectuarse sobre la componente temática del dato geo- 
gráfico, en cuyo caso emplean los mismos mecanismos que las bases de datos 
fuera de un SIG. Esto incluye el empleo de lenguajes de consulta, específicamente 
desarrollados para esta tarea. El lenguaje SQL (Structured Query Language) es 
el más habitual de estos. 

Al incorporar la componente espacial, se añaden nuevos elementos para realizar 
consultas. Los criterios de consulta añaden predicados espaciales basados en las 
relaciones entre las distintas entidades, y estos a su vez pueden combinarse con los 
predicados no espaciales para la formulación de consultas complejas. Los lenguajes 
de consulta se extienden para dar cabida a estos nuevos predicados, así como a 
funciones espaciales basadas en las propias entidades de las capas. 

La aplicación de criterios espaciales hace necesaria la utilización de índices 
espaciales para optimizar el trabajo con grandes volúmenes de datos. Estos índices 
estructuran los datos de tal modo que en la realización de consultas espaciales no es 
necesario efectuar dicha consulta sobre la totalidad de los datos, sino únicamente 
sobre una fracción de ellos. 



Capítulo 12 


Estadísticas espaciales 


En este capitulo veremos cómo realizar análisis estadísticos sobre datos espaciales, 
adaptando los descriptores clásicos a la información espacial. Asimismo, estudiaremos 
otros parámetros exclusivos para datos espaciales, tales como aquellos que se emplean para 
el estudio de patrones de puntos. 

Un elemento clave del análisis estadístico es el variograma, que analizaremos en pro- 
fundidad. El uso de este elemento es básico para la aplicación de métodos de interpolación 
geoestadísticos que veremos más adelante (Capítulo 13). 

Unos conocimientos básicos de estadística descriptiva son necesarios para seguir el 
contenido de este capítulo. 


12.1. Introducción 

La información espacial es susceptible de ser analizada estadísticamente como 
cualquier otro tipo de información. Una serie de n datos recogidos en otros tantos 
puntos no deja de ser una serie de datos sobre la que pueden aplicarse las técnicas 
estadísticas habituales. No obstante, cada uno de estos datos tiene asociada una 
coordenada, y esta aporta una información adicional que puede emplearse igual- 
mente para obtener resultados estadísticos de diversa índole. Más aún, como ya 
vimos, el análisis en exclusiva de los valores sin considerar la componente espacial 
asociada a estos puede no ser adecuado por no cumplir algunos de los supuestos 
de la estadística clásica. 

Si trabajamos en el plano cartesiano, en lugar de una serie de valores de una 
variable a disponemos de una serie de ternas ( x,y,a ). Extendiendo la posibilidad 
de analizar estadísticamente los valores a recogidos en esa serie de localizaciones, 
encontramos otras dos formas de analizar este conjunto. 

■ Analizar la disposición espacial, con independencia de los valores. Es decir, 
estudiar el conjunto de pares de valores (x,y) 

■ Analizar la disposición espacial y los valores recogidos. Es decir, estudiar 
el conjunto de ternas ( x,y,a ) 

Por la concepción anterior, este tipo de análisis se lleva a cabo preferentemente 
sobre capas de tipo punto. No obstante, algunos de estas formulaciones pueden 
igualmente aplicarse a capas ráster, considerando que cada celda conforma de igual 
modo una terna de valores, pues su localización espacial está perfectamente definida. 
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El análisis estadístico espacial incluye procedimientos muy diversos. Dentro 
de este capítulo analizaremos algunos de los más básicos, como son los siguientes: 

■ Medidas centrográficas. El equivalente espacial de las medidas de tenden- 
cia central como el momento de primer orden (media) o la mediana, así como 
de las de dispersión tales como el momento de segundo orden (desviación 
típica) . 

■ Análisis estadístico de líneas. Descriptores estadísticos para líneas y 
ángulos. 

■ Análisis de patrones de puntos. Este tipo de análisis permite caracterizar 
la estructura espacial de un conjunto de puntos en función de parámetros 
como la densidad o las distancias entre puntos y su configuración en el espacio. 

■ Autocorrelación espacial. Los puntos cercanos tienden a tener valores 
más similares entre sí que los puntos alejados. Este fenómeno puede cuan- 
tificarse y estudiarse con una serie de índices, así como mediante elementos 
tales como variogramas o correlogramas. 

Debido a su entidad, otro grupo de procedimientos con componente estadística, 
los relativos a las técnicas de interpolación, se verán en un capítulo independiente 
(Capítulo 13). De igual modo, aquellas que permiten el calculo de densidades se 
recogen también en dicho capítulo. 

Un capítulo dedicado a la aplicación de otras técnicas estadísticas más com- 
plejas tales como técnicas de agrupación o regresiones espaciales (Capitulo 20) 
completa este grupo de secciones dedicadas a los elementos estadísticos. 


12.2. Medidas centrográficas 

Las medidas centrográficas representan descriptores básicos de los datos espa- 
ciales, extendiendo las medidas de tendencia central y dispersión de la estadística 
clásica al ámbito espacial. 

La principal medida de tendencia central espacial es el centro medio. El centro 
medio es un punto cuyas coordenadas son la media en cada eje de las coordenadas 
de los puntos analizados (Figura 12.2). Es decir, el punto (x,y) tal que 


x = 

y= 


Eg=i Xi 
N 

Ejk yi 

N 


(12.2.1) 


Cada uno de los puntos puede ponderarse según el valor recogido en el mismo, 
de forma que lo anterior quedaría como 
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N 

J2i=iaiXi 


x = 


Ehat 


N 

V ~ Ehai 


(12.2.2) 


El centro medio es el centro de gravedad del conjunto de puntos, tomando como 
masa de cada uno el valor asociado a este. Asimismo, es el punto que minimiza 
la suma de distancias al cuadrado, esto es, la expresión 


N N 

dic = ^2ix- x i) 2 + {jj-y i )‘ ¿ (12.2.3) 

Í= 1 2=1 

Un uso habitual del centro medio lo encontramos en los estudios demográficos, 
que pueden analizar la evolución de las poblaciones sobre el territorio estudiando 
cómo se ha desplazado el centro medio a través del tiempo 

El equivalente espacial de la mediana es el centro mediano. Al igual que el 
centro medio, el centro mediano es también un punto. En este caso sus coordenadas 
son las medianas de las de los puntos analizados en cada eje [148]. 

Puede ser interesante también analizar el centro mediano como una linea en 
lugar de un punto. Por ejemplo, una linea vertical que pasa por la componente 
en x del centro mediano. Si trabajamos con una serie de puntos que representan 
poblaciones y estos se ponderan según su número de habitantes, esta línea divide 
el territorio en dos zonas igualmente pobladas. La mitad de los habitantes viven 
a un lado de ella, y la otra mitad al otro lado. 

En la figura 12.1 puede verse una representación de lo anterior. 

El inconveniente del centro mediano es que depende de los ejes escogidos y no 
es por tanto invariante ante rotaciones. Para solucionar esto suele emplearse como 
definición alternativa la de aquel punto del espacio que hace mínima la suma de 
distancias a todos los puntos de datos[149]. El cálculo de este punto requiere de 
un proceso iterativo [150] en el cual se tiene que 


x 


y = 


i T . 

2-¡i = l clí x i- 
^i=l Oi 


V JV “¿7/- 

2-^i = i ai a 1 

spN di 
2-a= 1 a. 


(12.2.4) 


(12.2.5) 


donde di es la distancia del punto i-ésimo a la localización del centro mediano en 
la iteración actual. Como primera coordenada para iterar, una buena elección es 
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Figura 12.1: Centro mediano y lineas de división pasando por este, las cuales dividen el 
conjunto de puntos en dos partes iguales a Este y Oeste, y Norte y Sur, respectivamente. 


el propio centro medio. El proceso se detiene cuando la distancia entre el nuevo 
centro mediano y el de la iteración anterior es menor que un determinado umbral 
establecido de antemano. 

Respecto a las medidas de dispersión, el equivalente a la desviación típica es 
la denominada distancia típica , cuya expresión es la siguiente [151] 


Sd = 



siendo di la distancia entre el punto i-ésimo y el centro medio. 
También puede escribirse lo anterior como 


(12.2.6) 


X^ N T 

N 


Sd = 


\ 


— x 



(12.2.7) 


Es interesante comentar que la distancia a la media en el concepto habitual 
de desviación típica puede ser positiva o negativa (de ahí que se eleve al cuadrado 
y después se aplique la raíz), mientras que en el caso espacial es siempre positiva. 

Una forma de representar esta distancia típica es mediante un circulo de radio 
dicha distancia centrado en el centro medio (Figura 12.2) 

La distancia típica puede, igualmente, calcularse ponderando los distintos 
puntos, quedando su expresión como 



Sd = 


(12.2.8) 
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Figura 12.2: Circulo de radio igual a la distancia típica centrado en el centro medio del 
conjunto. 


Mediante esta representación se asume, no obstante, que la dispersión es la 
misma en todas direcciones. Esta simplificación raramente es cierta, y es más 
correcto definir en lugar de un círculo una elipse de desviación. Esta elipse de 
desviación viene definida por sus semiejes mayor y menor, en los cuales se dan, 
respectivamente, la mayor y menor dispersión. El ángulo a que define al semieje 
mayor x' viene expresado según 


siendo dxi y dyi las distancias en los ejes x e y respectivamente entre el punto 
i-ésimo y el centro medio. 

El semieje menor es perpendicular al anterior. 

Las distancias típicas en cada uno de estos dos semiejes vienen expresadas por 


tana 


2 E¿Ii dxidyi 



2Y J i=idx i dy i 


(12.2.9) 



i = 1 


(12.2.10) 
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2=1 
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eos 2 a 

2=1 




sinacosa 


(12.2.11) 


Por último, la medida de desviación relativa que equivale en la estadística 
espacial al coeficiente de variación es la distancia relativa [152], que se calcula 
dividiendo la distancia típica por el radio de un círculo con el mismo área que la 
zona de estudio. Si esta zona es circular, se tiene por tanto 

Sd,rel = ^ (12.2.12) 

siendo R el radio de la zona de estudio. 

En caso de que esta zona sea cuadrada y de área A , se tiene que 


Sd,rel 



(12.2.13) 


En la figura 12.3 puede verse cómo distribuciones espaciales iguales (con la 
misma distancia típica) representan dispersiones relativas distintas en relación 
a la zona de estudio. 



Figura 12.3: Aunque ambas distribuciones tienen la misma distancia típica, la dispersión 
en relación al área analizada es distinta, con lo que los valores de distancia relativa serán 
distintos. 


12.3. Estadísticas sobre líneas. Variables circulares 

Dentro de los objetos geográficos, las líneas merecen algunos comentarios 
aparte en lo que a su análisis respecta. Tanto las líneas como los polígonos pueden 
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ser reducidos en ultima instancia a puntos (los polígonos bien por sus puntos consti- 
tuyentes o bien por el centroide, el cual coincide con el centro medio), y analizados 
estos con algunas de las fórmulas antes vistas o las que se verán más adelante. La 
particularidad de las lineas estriba en que, además de valores puntuales o de área 
(como los de los polígonos), definen igualmente direcciones y ángulos de giro entre 
sus segmentos. El análisis estadístico de variables circulares como estas presenta 
sus propias particularidades, que deben conocerse para poder extraer resultados 
correctos a partir de datos de esta índole. 

Un ejemplo del uso de variables direccionales lo encontramos, por ejemplo, en 
el estudio de desplazamientos de animales cuyas rutas hayan sido monitorizadas 
y se encuentren dentro de un SIG como capas de líneas. Un situación similar se da 
en el caso de elementos que no representen un movimiento pero tengan dirección, 
tales como fallas u otros elementos geológicos. No obstante, los conceptos relativos 
a este tipo de variables también tienen aplicación para cualquier información simi- 
lar, con independencia de su formato de almacenamiento. Así, son de aplicación, 
entre otros, para el estudio de orientaciones dentro del análisis geomorfométrico 
(Capítulo 15), el cual se lleva a cabo fundamentalmente sobre capas ráster. 

En el caso que nos ocupa del estudio de líneas, pueden considerarse todos y 
cada uno de los segmentos de estas como líneas en sí, o bien la linea ficticia que 
une el inicio del primer segmento con el final del último. 

A continuación se mostrarán brevemente los estadísticos más frecuentes para 
datos circulares, con especial énfasis en su aplicación al análisis de líneas dentro 
de un SIG. Descripciones más detalladas de estos y otros elementos de estadística 
circular, junto a sus aplicaciones en áreas donde el empleo de SIG es habitual, 
pueden consultarse en [153] o [154]. 

Para comenzar, el cálculo de la media de dos ángulos ejemplifica bien las particu- 
laridades de los datos circulares. Sean tres ángulos de 5 o , 10°y 15°respectivamente. 
El concepto habitual de media aplicado a estos valores resultaría en un ángulo 
medio de 10°, correcto en este caso. Si giramos ese conjunto de ángulos 10 grados 
en sentido antihorario, dejándolos como 355°, 0 o , 5 o , la media debería ser 0 o , pero 
en su lugar se tiene un valor medio de 120°. 

Una forma correcta de operar con ángulos ai,...,a n consiste en hacerlo con las 
proyecciones del vector unitario según dichos ángulos, es decir sinai,....sina n y 
cosaq,....cosaí n . Aplicando luego los estadísticos habituales sobre estos valores se 
obtienen unos nuevos valores de senos y cosenos que permiten obtener el ángulo 
resultante aplicando sobre ellos la función arcotangente. 

En el caso de segmentos orientados tales como los que constituyen las líneas den- 
tro de una capa de un SIG, resulta conveniente tratar cada segmento como un vector. 
La resultante de su suma vectorial será otro vector con la dirección media de todos 
los segmentos, y cuyo módulo (longitud) aporta información acerca de la tendencia 
y variación de las direcciones a lo largo de la linea. Si la dirección es uniforme, el mó- 
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dulo será mayor, siendo menor si no lo es (Figura 12.4) . El vector resultante puede di- 
vidirse por el número total de segmentos iniciales para obtener una media vectorial. 

Es decir, se tiene un vector cuya orientación viene definida por un ángulo a 
tal que 


S 

a = arctan— 
O 


y con un módulo R según 


Vs 2 +c 2 

N 

siendo S y C las sumas de senos y cosenos, respectivamente. 

N 


N 

S = y^sina¿ 

Í= 1 


S = y^COS Q.j 
2=1 


(12.3.1) 


(12.3.2) 


(12.3.3) 


El módulo R se conoce también como concentración angular y es una medida 
inversa de la dispersión angular. No obstante, hay que tener en cuenta que valores 
próximos a cero, los cuales indicarían gran dispersión, puede proceder de dos agru- 
paciones de ángulos similares (es decir, con poca dispersión) si estas agrupaciones 
se diferencian entre sí 180°. 



Cuando se trabaja con direcciones en lugar de orientaciones, es frecuente 
multiplicar por dos los valores angulares y posteriormente simplificar el ángulo 
aplicando módulo 360°. Es decir, aplicar la transformación a' = 2a mód360°. 

La forma en que las distintas orientaciones se congregan entorno a la media, rela- 
cionada directamente con la dispersión, puede servir para inferir la existencia de una 
dirección predominante o bien que los valores angulares se hallan uniformemente dis- 
tribuidos. La comprobación de que existe una tendencia direccional es de interés pa- 
ra el estudio de muchos procesos tales como el estudio de movimiento de individuos 
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de una especie, que puede denotar la existencia de una linea migratoria preferida o re- 
velar la presencia de algún factor que causa dicha predominancia en las direcciones. 

Existen diversos test que permiten aceptar o rechazar la hipótesis de existencia 
de uniformidad entre los cuales destacan el test de Rayleigh, el test V de Kuiper 
[155] o el test de espaciamiento de Rao [156] 

Para este último, se tiene un estadístico U según 

1 N 

U=-T,m-M\ (12.3.4) 

1= 1 

siendo 


360 

■ ~w 


(12.3.5) 


T,= 


a.i + i—o¿i sil<i<N— 1 
360 — a n +a\ siz = lV 


(12.3.6) 


Puesto que las desviaciones positivas deben ser iguales a las negativas, lo 
anterior puede simplificarse como 


N 

U = Y / m-X) (12.3.7) 

Z— 1 

Para un numero de puntos dado y un intervalo de confianza establecido, los 
valores de U están tabulados, y pueden así rechazarse o aceptarse la hipótesis nula 
de uniformidad. Dichas tablas pueden encontrarse, por ejemplo, en [157]. 

12.4. Análisis de patrones de puntos 

Las coordenadas de un conjunto de puntos no solo representan una información 
individual de cada uno de ellos, sino de igual modo para todo el conjunto a través 
de las relaciones entre ellas. La disposición de una serie de puntos en el espacio 
conforma lo que se conoce como un patrón de puntos, el cual puede aportar infor- 
mación muy valiosa acerca de las variables y procesos recogidos en dichos puntos. 
Por ejemplo, si estos representan lugares donde se han observado individuos de 
una especie, su distribución espacial puede, por ejemplo, servir como indicador 
de la interacción entre dichos individuos o con el medio. 

La caracterización de un patrón de puntos es, por tanto, de interés para la 
descripción de estos, y se realiza a través de análisis estadísticos y descriptores 
que definen la estructura del mismo. 

Para llevar a cabo este análisis se asume que la estructura espacial de un patrón 
dado es el resultado de un proceso puntual. Se entiende por proceso puntual un 
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proceso estocástico que genera tales patrones, compartiendo todos ellos una similar 
estructura (la ley de dicho proceso). Los puntos son eventos de dicho proceso. 
Describiendo el tipo de patrón se obtiene información sobre el proceso puntual 
que lo ha originado. 

Podemos encontrar múltiples ejemplos de procesos puntuales, tales como la 
disposición de individuos de una especie, la disposición de los árboles en un bosque 
o la aparición de casos de una enfermedad. Cada uno de ellos tiene sus propias 
características. 

Como se puede observar en la figura 12.5, existen tres tipos de patrones que 
un proceso de puntos puede generar: 

■ Agregado. La densidad de los puntos es muy elevada en ciertas zonas. 

■ Aleatorio. Sin ninguna estructura, las posiciones de los puntos son inde- 
pendientes entre sí. 

■ Regular. La densidad es constante y los puntos se disponen alejados entre sí. 



Figura 12.5: De izquierda a derecha, patrones de puntos agregado, aleatorio y regular. 

El análisis de patrones de puntos se fundamenta básicamente en la comparación 
entre las propiedades de una distribución teórica aleatoria (distribución de Poisson) 
y las de la distribución observada. Esta distribución teórica aleatoria cumple que se 
da aleatoriedad espacial completa (CSR, Complete Spatial Randomness, en inglés). 
De este modo, se puede decidir si esta última es también aleatoria en caso de existir 
similitud, o bien es de alguno de los dos tipos restantes, según sea la discrepancia 
existente. 

Las propiedades a comparar pueden ser: 

■ Propiedades de primer orden. La intensidad del proceso A (h), definida 
como la densidad (número de puntos por unidad de área). En general, se 
asume que es una propiedad estacionaria, esto es, constante a lo largo de la 
zona de estudio. Existen distribuciones como la distribución no homogénea 
de Poisson que asumen una variabilidad de la intensidad a lo largo de la 
zona de estudio. En el apartado 13.3 veremos cómo crear capas continuas 
de esta intensidad \{h). 

■ Distancia entre puntos. Relaciones entre cada punto con los de su entorno. 
Basado en las denominadas propiedades de segundo orden. 
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12.4.1. Análisis de cuadrantes 

En el primero de los casos, la metodología de análisis de cuadrantes divide la 
zona de estudio en unidades regulares, cuadrantes , y estudia el número de puntos 
que aparecen dentro de cada una. 

La forma de estas unidades puede ser cualquiera, aunque lo habitual es emplear 
unidades cuadradas, de ahí la denominación. Debido a los efectos de escala, el 
tamaño de estas unidades tiene una gran influencia en los resultados obtenidos. 
Un tamaño habitual es el doble del área media disponible para cada punto, es 
decir, cuadrados cuyo lado tendrá una longitud 


1 = 



(12.4.1) 


siendo N el número de puntos y A el área de la zona de estudio. 

Suponiendo un área de 1 km 2 , el lado del cuadrante para analizar los ejemplos 
de la figura 12.6 será de 353 metros. 

Con la serie de datos que indica el conteo de puntos en cada cuadrante, se 
procede al análisis estadístico. Este puede hacerse comparando los conteos en los 
cuadrantes o según la relación entre la media y la varianza de la serie. En este 
segundo caso, partimos de que en una distribución aleatoria es de esperar una 
varianza igual a la media [158]. Por tanto, el cociente entre la varianza y la media 
debe ser cercano a 1. Si en la distribución analizada este cociente está próximo a 
ese valor, se tratará de una distribución aleatoria. En una distribución uniforme, la 
varianza (y por tanto el cociente con la media) será cercana a 0. En las distribución 
agrupadas, la varianza sera mayor, y el cociente por tanto superior a 1. 

El análisis de cuadrantes no es en realidad una medida del patrón, sino de la 
dispersión. Además, debido al uso de una unidad de análisis (el cuadrante) fija, 
puede no ser capaz de localizar agrupamientos locales en esta. 

Otra debilidad de este método es que no es capaz de diferenciar entre distri- 
buciones tales como las de la figura 12.6, claramente distintas pero que arrojan 
un resultado idéntico al aplicar esta metodología con los cuadrantes mostrados. 



• • 


Figura 12.6: Dos disposiciones de puntos distintas que darían un mismo resultado al 
analizarse por el método de cuadrantes. 
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No obstante, la aplicación de este método en campos como la biología es muy 
habitual, y se han desarrollado numerosas extensiones del mismo tales como el 
índice de David-Moore [159], el índice de frecuencia de agregados [160], o el índice 
I¿ de [161], entre otros muchos. 

12.4.2. Análisis de vecino más cercano 

El método de vecino más cercano [162] permite solventar algunos de los pro- 
blemas asociados al análisis de cuadrantes. Para ello, se basa en las distancias de 
cada punto a su vecino más cercano. Comparando estas distancias con el valor que 
cabe esperar en una distribución aleatoria, puede deducirse el tipo de estructura 
en la distribución observada. 

El valor que define el patrón de puntos a estudiar es el índice de vecino más 
cercano , que se calcula como 


j d mc 

mc ~E(d mc ) 

siendo d mc la media de las distancias al punto más cercano, según 


dmr. — 


UU dr 

N 


(12.4.2) 


(12.4.3) 


E(dmc) es la media esperada en una distribución de Poisson, y se calcula según 
la expresión 


(12.4.4) 

siendo A la densidad de puntos por unidad de área, es decir 

N 

\=- (12.4.5) 

[163] propone corregir lo anterior para tener en cuenta los efectos de borde, 
utilizando la siguiente expresión: 


/* = 


2\/A 


A= 


— ^+0,0514+ 

2^A 


0,041 B 

Vñ ñ 


(12.4.6) 


donde B es la longitud del perímetro del área estudiada. 

El índice de vecino más cercano tiene un valor de 1 en una distribución aleatoria, 
menor de 1 en una distribución agregada y mayor en una regular. 

La desviación típica de las distancias se estima según 



Vd = 


(12.4.7) 
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Aleatoria 

Regular 

Agregada 

Dist. media 

8,802 

13,658 

3,759 

Varianza 

0,599 

0,654 

0,419 

Varianza corr. 

0,659 

1,03 

0,942 

NNI 

1,487 

2,207 

0,759 

NNI corr. 

1,323 

1,964 

0,675 


Cuadro 12.1: Valores relativos al índice de vecino más próximo para los distintos 
tipos de distribuciones del ejemplo propuesto. NNI es el indice de vecino más próximo 
(. Nearest-Neighbour Index). 


Aplicando como en el caso de la media una corrección de los efectos de borde, 
se tiene 


o -d = 


N 


0,070—^+0,0375 

N z 



(12.4.8) 


Conociendo este resultado y que bajo la hipótesis de aleatoriedad espacial 
completa puede asumirse una distribución normal de los valores de distancia con 
la media y la desviación típica anteriores, pueden hacerse test de significación 
para conocer con qué grado de confianza es posible afirmar que la distribución 
analizada es o no aleatoria. 

La tabla 12.1 muestra con más detalle los resultados correspondientes al análisis 
de vecino más cercano para los tres tipos de distribuciones mostradas. 

El análisis de vecino más cercano puede ampliarse al de los n vecinos más 
cercanos. No obstante, este tipo de formulaciones se implementan con mucha 
menor frecuencia y son significativamente más complejas que las basadas en un 
único punto vecino. 


12.4.3. Función K de Ripley 

El problema de escala vimos que era patente en el método del análisis de 
cuadrantes, puesto que existía una fuerte dependencia del tamaño del cuadrante. La 
función K de Ripley trata de incorporar la escala como una variable más del análisis, 
convirtiendo dicha dependencia en un hecho favorable en lugar de una desventaja. 

Para ello, en lugar de fijar una escala de análisis y una serie fija de cuadrantes 
de análisis, se tiene una serie aleatoria de zonas de análisis, las cuales se estudian a 
distintas escalas (con distintos tamaños). Para un proceso puntual dado, se trata 
de obtener una función que indique cuál es el numero de ocurrencias que deben 
darse a una distancia menor que un umbral dado h de cualquier punto generado 
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por dicho proceso. La función que cumple esta definición se denomina función K 
[164], y puede expresarse como 

K(h) = \E(n) (12.4.9) 

A 

donde n es el número de eventos a distancia menor que h de un evento aleatorio 
cualquiera. La intensidad A se añade para eliminar la influencia de la densidad, 
ya que el valor esperado de puntos a una distancia dada está en relación directa 
con dicha densidad. 

Tiene sentido estudiar esta función tan solo para valores de h pequeños en 
comparación con el tamaño de la zona de estudio, ya que para otros valores no 
resulta coherente analizar los efectos de segundo orden dentro de dicha zona. Por 
ello, lo habitual es aplicar esta función solo a los valores de h menores que la mitad 
de la dimensión menor de la zona de estudio. 

Un estimador de la función K es 


K(h) 


1 


N N 

E E Ih(dv) 


siendo Ih una función indicadora de la forma 


(12.4.10) 


Ih(dij — 


1 

0 


si dij < h 
si dij > h 


(12.4.11) 


En este estimador no se consideran los efectos de borde, y aquellos puntos 
situados cerca de la frontera de la zona de estudio tendrán estimaciones inferiores 
a las reales. Un estimador que corrige estos efectos [164] es el siguiente: 


K(h) 


\ 2 A 


N N 

E E 

i=lj=ljjLi 


h(djj) 

Wij 


(12.4.12) 


El valor Wij pondera los distintos puntos en función de su distancia al borde 
de la zona de estudio. Para calcularlo se traza una circunferencia por el punto i 
con radio d t j (es decir, una circunferencia con centro en el punto i y que pasa por 
el punto j ) , siendo la fracción de dicha circunferencia que queda dentro de la 

zona de estudio (Figura 12.7). 

Hay que tener en cuenta que en ocasiones no es conveniente aplicar el efecto 
de borde, por ejemplo en el caso en que el proceso puntual subyacente no tenga 
lugar fuera de la zona de estudio. 

Puesto que la densidad se estima como A = ^ , la expresión del estimador de 
la función K queda finalmente como 


K(h) 


A N N 

^E E 


Ih{d; 


V) 


i=ij= i,jAi 


Wij 


(12.4.13) 
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Figura 12.7: Corrección del estimador K(h ) en función de los efectos de borde. El 
parámetro de corrección es el cociente entre la longitud interior (en trazo continuo) y 
la total de la circunferencia 

Para interpretar el significado de la función K, se tiene que, en condiciones de 
aleatoriedad espacial completa, el número de eventos a una distancia menor que h 
es irh 2 . Esto es, K(h) = Trh 2 . Comparando los valores esperados con los estimados, 
se tiene que si K(h) < K(h ) existe agrupamiento, mientras que si K(h) > K(h ) 
existe regularidad en la distribución. 

Para esta interpretación resulta más habitual utilizar un estimador L(h ) de 
la forma 


m 



(12.4.14) 


de tal modo que valores positivos de la misma indican agregación, mientras que 
los negativos indican regularidad. 

Además de comparar el valor estimado con el valor esperado de la función 
K en condiciones de aleatoriedad espacial completa, puede compararse con el 
esperado para un proceso puntual determinado. Los valores de la función K son 
conocidos para muchos procesos puntuales, y esa información puede utilizarse 
para establecer comparaciones de igual modo. Distribuciones como las de Cox[165] 
o Gibbs han sido empleadas frecuentemente para el análisis de fenómenos tales 
como las distribuciones de pies dentro de masas forestales. 

Frente a este enfoque, existe también la posibilidad de realizar un número 
n (preferiblemente grande) de simulaciones de un proceso y calcular la media y 
desviación típica de los valores de la función K obtenidos en ellas. Con ellos puede 
posteriormente calcularse la probabilidad de que una distribución observada de 
puntos represente un resultado generado por dicho proceso. 

Al igual que los métodos restantes, el empleo de funciones K se realiza con 
carácter global, asumiendo la estacionaridad de la función K(h). No obstante, 
puede adaptarse a un uso local, considerando en lugar de una serie de puntos 
aleatorios, un punto concreto i. La expresión 12.4.12 puede particularizarse para 
dar un estimador de esta función K local, según 
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K(h) 


1 


N 

A 2 A . 

3 = 1 , 


Ihidij) 

Wij 


(12.4.15) 


Junto con los anteriores métodos de análisis de patrones de puntos, existen 
muchos otros en la bibliografía, siendo esta un área con un desarrollo notable en 
la actualidad. 


12.5. Autocorrelación espacial 

Como vimos en 10.2.3, la autocorrelación espacial indica la relación entre el 
valor de una variable existente en un punto dado y los de la misma variable en 
el entorno cercano de dicho punto. La autocorrelación espacial es la expresión 
formal de la primera ley geográfica de Tobler, y puede ser tanto positiva (los puntos 
cercanos exhiben valores más similares que los puntos lejanos) o negativa (los 
puntos lejanos exhiben valores más similares que los puntos cercanos). 

El desarrollo realizado entonces se centraba en tratar las implicaciones que la 
existencia de autocorrelación espacial tiene para el análisis estadístico de datos 
espaciales. En este apartado veremos índices que permiten evaluar el grado de 
autocorrelación espacial existente, así como elementos mediante los cuales dicha 
autocorrelación podrá utilizarse posteriormente como parte integrante de otras 
formulaciones, en particular las relacionadas con interpolación (Capítulo 13). 

12.5.1. La matriz de ponderación espacial 

El concepto de autocorrelación espacial implica la definición de una vecindad 
de los distintos elementos geográficos. Se tiene que los valores de una variable 
registrados en aquellos elementos vecinos ejercen una influencia sobre los valores 
de dicha variable en un punto dado. Por ello es importante definir cuándo dos 
elementos son vecinos o no. 

Aunque trabajamos con datos puntuales, este concepto de vecindad puede 
asociarse a otro tipo de entidades, como por ejemplo las de área. Así, puede 
considerarse que dos polígonos son vecinos si comparten al menos un lado común 
o, más restrictivamente, si comparten una longitud de sus perímetros mayor que 
un determinado umbral. 

Para el caso de puntos, esta vecindad puede establecerse por distancia, con- 
siderando vecinos a todos aquellos puntos a una distancia menor que un umbral 
establecido. Este umbral puede aplicarse en todas direcciones (isotropía) o ser 
variable en función de la dirección (anisotropía) . 

De forma general, pueden considerarse todos aquellos factores que hagan que 
una entidad ejerza influencia sobre otra, y en el grado en la que dicha influencia 
tenga lugar. Esto puede incluir la consideración de otras relaciones existentes, como 
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por ejemplo movimientos migratorios de especies, que «enlazan» unas entidades 
con otras y causan la existencia de interacción entre ellas más allá de la propia 
existente por distancia o contigüidad [166]. 

En la función K de Ripley ya vimos en la ecuación 12.4.10 cómo el uso del indica- 
dor I definía ese concepto de vecindad «efectiva» , ya que tomaba valor cero para los 
puntos a una distancia mayor que h, haciendo que dichos puntos no tuvieran efecto 
sobre el resultado final de la función. De forma similar, puede extenderse el concepto 
de este indicador para construir la denominada matriz de ponderación espacial. 

Para un conjunto de N entidades se tiene una matriz W de dimensiones NxN 
en la que el elemento Wij refleja la influencia de la entidad i sobre la j. Por con- 
vención, los valores wa son iguales a cero. En el caso más sencillo, la matriz es 
de tipo binario, conteniendo únicamente valores 1 (existe vecindad efectiva entre 
las entidades) o 0 (no existe vecindad), pero los valores pueden ser cualesquiera. 
En la práctica, es de hecho habitual dividir estos valores por la suma de todos los 
valores de la columna, de forma que estén acotados siempre entre 0 y 1. 

Mas allá de los valores que pueda contener, una característica primordial de 
la matriz de ponderación espacial es el método con el que ha sido creada, ya que 
la forma en la que se establece la vecindad entre los distintos elementos tiene 
influencia directa sobre dicha matriz, Esto, sin duda, afecta a las operaciones 
realizadas posteriormente sobre esta, por lo que la elección del método a emplear 
en su creación es altamente relevante. 

12.5.2. Medidas de autocorrelación espacial 

Dos son las medidas más habituales para cuantificar la autocorrelación espacial 
de una variable: el parámetro I de Moran [167] y el parámetro c de Geary [168]. 
Ambos hacen uso de la matriz de ponderación espacial antes descrita. 

En el caso del parámetro I de Moran, su expresión es 



(12.5.1) 


donde p, es la media de la variable a; y So es un factor de normalización igual a la 
suma de todos los elementos de la matriz. 


N N 



i=lj=l 


Si los valores de la matriz han sido normalizados dividiéndolos por la suma 
de las columnas, Sq = N y la expresión anterior se simplifica. 



N N 


(12.5.3) 
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El valor esperado de I es: 


E(I) = 

V ; JV-1 


(12.5.4) 


Valores por debajo de este valor esperado indican autocorrelación negativa, 
mientras que los situados por encima reflejan autocorrelación positiva. Al igual 
que sucede para otros parámetros, los valores de la desviación típica del parámetro 
I son conocidos, lo que permite establecer intervalos de confianza para rechazar 
o aceptar la hipótesis nula de ausencia de autocorrelación espacial. 

Estos valores de la desviación típica tienen distintas expresiones en función de 
bajo qué supuestos se determinen. Estos supuestos y las expresiones resultantes 
no se tratarán aquí, pero pueden consultarse, por ejemplo, en [169]. 

Respecto el parámetro c de Geary, su expresión es 


Mientras que el parámetro I da una caracterización más global, el parámetro 
c es más sensible a las variaciones locales a distancia reducida. 

El valor esperado de c es 1. Valores menores de 1 indican autocorrelación 
espacial positiva, mientras que los superiores indican una autocorrelación negativa. 

Ambos parámetros son parte de una familia de estadísticos denotadas como 
r, de la forma 


Con este esquema pueden expresarse otros indicadores tales como los deno- 
minados índices de conteo conjunto ( joint count ) [169] u otros más específicos. 

Todo estos parámetros caracterizan la autocorrelación espacial para el conjunto 
completo de puntos, es decir, para todo el área de estudio. Junto a estos, existen 
otros parámetros que miden la autocorrelación espacial a nivel local. 

[170] proponen dos nuevos parámetros Gi(d) y G*(d) que cuantifican si un 
punto dado i se encuentra rodeado por agrupaciones de puntos con valores altos 
o bajos. En el caso de Gi(d) no se tiene en cuenta el valor del punto i mientras que 
en el caso de G* (d) sí se emplea este. 

De forma similar, [171] propone una versión local del parámetro I de Moran, 
denotándolo como indicador local de asociación espacial ( Local Indicator of Spatial 
Association, LISA). 

La forma de interpretar estos parámetros locales es similar a lo visto ante- 
riormente, y las formulaciones concretas de cada uno pueden consultarse en las 
referencias correspondientes. 



(12.5.5) 


N N 



(12.5.6) 
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12.5.3. Variogramas 

Los variogramas son elementos clave para definir la autocorrelación espacial 
y aprovechar el conocimiento de esta dentro de formulaciones como el kriging (ver 
13.2.5). Los variogramas se fundamentan en el concepto de semivarianza. 

La semivarianza es una medida de la autocorrelación espacial de una variable 
x entre dos puntos i.j. y viene expresada por 

l{xi,x j ) = -{z i -z j ) 2 (12.5.7) 

El cuadrado de las varianzas se multiplica por ^ debido a que 7(27 ,Xj) = 7 (xj ,27) . 
De ahí el uso del prefijo semi. 

Puesto que puede calcularse la distancia entre dichos puntos, pueden repre- 
sentarse los valores de 7 frente a las distancias h. Se obtiene una nube de puntos 
(nube del variograma) como la mostrada en la figura 12.8. 



Figura 12.8: Representación de valores de semivarianza frente a distancia, formando 
la nube del variograma. 

Esta nube aporta en principio poca información, pero puede resumirse agru- 
pando los pares de puntos por intervalos de distancia, y calculando la media de 
todas las semivarianzas en cada intervalo. De esta forma se tiene una función que 
relaciona la semivarianza y la distancia entre puntos, según 

_. m(h) 

7(a)= 2íR7E (x, - 3 7 2 


(12.5.8) 
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siendo m(h) el número de puntos del conjunto separados entre sí por una distancia h. 

En la práctica se establecen una serie de valores de distancia equiespaciados, 
cada uno de los cuales define un intervalo centrado en dicho valor. La función m(h) 
representa el número de puntos en cada bloque. Es importante que este número de 
puntos en cada bloque sea significativo, especialmente para dar validez al posterior 
ajuste sobre estos valores medios, como más adelante veremos. 

La función 7 (h) es lo que se conoce como variograma experimental 1 
La nube de puntos de la figura 12.8 se resume en el variograma de la figura 12.9. 


Nugget 



Sil! 


Figura 12.9: Resumen de la nube del variograma en un variograma experimental con 
sus elementos definitorios. 

La elección de un tamaño óptimo para los intervalos es importante para obtener 
un variograma fiable. Si en el variograma aparecen ondulaciones, esto puede ser se- 
ñal de que existe un comportamiento cíclico de la variable, pero más probablemente 
de que la distancia del intervalo no ha sido bien escogida. 

Como puede verse en dicha figura, la curva que los puntos del variograma 
experimental describen implícitamente da lugar a la definición de unos elementos 
básicos que lo caracterizan. 

■ Rango. El rango representa la máxima distancia a partir de la cual existe 

1 Por emplear semivarianzas, es habitual también el uso del término semivariograma, aunque 
en general este se simplifica y se entiende que variograma hace referencia al elemento derivado 
de las semivarianzas. Será así como se emplee dentro de este texto. 
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dependencia espacial. Es el valor en el que se alcanza la máxima varianza, 
o a partir del cual ya presenta una tendencia asintótica. 

■ Sill 2 . El máximo del variograma. Representa la máxima variabilidad en 
ausencia de dependencia espacial. 

■ Nugget. Conforme la distancia tiende a cero, el valor de la semivarianza 
tiende a este valor. Representa una variabilidad que no puede explicarse 
mediante la estructura espacial. 

El valor de la función ha de ser, lógicamente, cero en el origen. 

Por ejemplo, para el caso de la figura propuesta estos valores pueden estimarse 
aproximadamente a primera vista como rango ~ 3000, sill — 700 y nugget ~ 300. 

Puesto que existen procesos para los cuales la variación de valores no se da 
igual en todas las direcciones, existen también variogramas anisotrópicos que 
no solo indican la variación media dentro de un intervalo de distancia, sino que 
caracterizan esa variación para una distancia y una dirección concreta. 

Una forma de visualizar cómo la variación es distinta en función de la dirección 
considerada es a través de una superficie variográficas . Estas superficies no son 
mapas como tales (la superficie variográfica a partir de una capa ráster no tiene 
las mismas coordenadas que esta. De hecho, no tiene coordenadas absolutas en el 
espacio), sino que, respecto a un punto central en el cual la variación es lógicamente 
cero, expresan en cada celda el valor medio que se da a la distancia y dirección 
que dicha celda define respecto al punto central. 

Si se traza un perfil de valores de esta superficie desde el punto central hasta un 
extremo de esta y en una dirección dada, el conjunto de dichos valores conforma 
el variograma particular de esa dirección 

A partir de los puntos que forman el variograma experimental, puede definirse 
un modelo que aporta información sobre el proceso subyacente, a partir de su forma 
y sus parámetros. La definición de este modelo implica el ajuste de una curva a 
los puntos del variograma experimental, y tiene como resultado la obtención de un 
variograma teórico. En la figura 12.9 puede verse junto a los puntos del variograma 
experimental una curva ajustada a estos que define el variograma teórico. Sobre 
este último se pueden conocer las semivarianzas para cualquier distancia h, no solo 
para las definidas por los intervalos como en el caso del variograma experimental. 

Existen muchas alternativas para elegir una función para el variograma teórico. 
Una función apta para este propósito debe cumplir los siguientes requisitos: 

■ Ser monótona creciente. 

■ Tener un máximo constante o asintótico. Es decir, un valor definido del 
sill. Funciones no acotadas superiormente, tales como las exponenciales, 
indicarían que la zona de estudio no es suficientemente grande, ya que no 


2 Tanto Sill como Nugget son términos ingleses que se emplean sin traducir de forma habitual, 
por lo que será así como se citen en este texto. 
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alcanza la dimensión a partir de la cual el efecto de la dependencia espacial 
deja de existir. 

■ 7 ( 0 ) > 0. Es decir, el nugget debe ser positivo. 

Sobre la base anterior, se pueden establecer familias principales de funciones 
aptas para definir un variograma teórico: 

■ Nugget puro. Funciones constantes de la forma 

7 (h) = C 0 ; V/rO (12.5.9) 

En este caso, la aplicación del kriging no resulta posible, y el valor estimado 
en un punto es la media de los valores muestreados. 

■ Funciones que alcanzan el valor del sill (c) para un rango concreto (a). Son 
funciones de la forma 


**>={ í ix) ;;¡r <>«■«» 

siendo las más habituales de las funciones f(x) las de tipo lineal, circular o es- 
férico. Las formulas detalladas de estas y otras funciones pueden consultarse, 
por ejemplo en [172] 

■ Funciones que tienden asintóticamente al valor del sill (c). Se define un 
rango efectivo, siendo este en el cual se da 7 (^ 1 ) = 0,95c. Entre estas funciones 
destacan 

Exponencial 

'y(h) =c^l — (12.5.11) 

Gaussiana 

/ -9 h? \ 

7 (h) = c( i — e~NN~ j (12.5.12) 

Algunos autores como [173] usan h directamente en lugar de 3/i, en cuyo caso 
el rango no es igual a o, sino a | 

El empleo de uno u otro modelo dependerá del conocimiento que tengamos 
acerca del proceso modelizado. 

La figura 12.10 muestra las gráficas de los tipos de variogramas anteriores. 

Llevar a cabo el ajuste del variograma teórico no es en absoluto un proceso 
trivial. Lo más sencillo es tratar de minimizar el error cuadr ático. No obstante, 
deben tenerse en cuenta algunas consideraciones adicionales como las siguientes: 

■ No todos los puntos del variograma experimental son igual de precisos. Si 
en un intervalo solo había cinco puntos en la nube del variograma mientras 
que en otro había 50, debe favorecerse un ajuste correcto sobre este último 
antes que sobre el primero, ya que su precisión será mayor. 
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Figura 12.10: Distintos modelos de variograma teórico con los mismos parámetros de 
forma. 


■ Los puntos para valores altos del espaciamiento h son menos relevantes y 
debe darse más importancia en el ajuste a los relativos a valores bajos. Esto 
se debe a que el objeto del variograma es modelizar la influencia que ejercen 
los puntos cercanos, y más allá del valor del rango esa influencia no se da, con 
lo que no es una parte de interés del variograma. Asimismo, la aplicación del 
kriging se realiza utilizando la parte inicial del variograma (valores pequeños 
de h), especialmente cuando hay una gran densidad de datos, por lo que 
resulta más apropiado tratar de minimizar los errores en esta parte inicial. 

Una solución para incorporar lo anterior es, en lugar de minimizar el error 
cuadrático total, minimizar este ponderado según el número de puntos en cada 
intervalo y las distancias de estos. Es decir, minimizar 

b N- 

(12.5.13) 

¿=i 

siendo b el número de intervalos, 7 (ú¿) el valor en el variograma experimental y 
7 (hi) el valor en el variograma teórico. 

La inspección visual del ajuste es también importante y resulta conveniente 
llevarla a cabo. 

Por último es importante señalar que el número total de puntos considerados de- 
be tenerse en cuenta para saber si el variograma teórico calculado es fiable o no. Aun- 
que resulta imposible establecer fórmulas exactas al respecto, se acepta generalmen- 
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te que con menos de 50 puntos la fiabilidad del variograma será dudosa. Valores entre 
100 y 150 son adecuados, y mayores de 250 puntos garantizan un variograma fiable. 
En el caso de tratarse de variogramas anisotrópicos, estos números son mayores. 

12.5.4. Correlogramas 

Para dos variables independientes x e y dadas, se define la covarianza de una 
muestra como 


Puede aplicarse este concepto para una única variable dada. Para dos puntos 
dados, su covarianza es 


El conjunto de valores de covarianza y distancias entre puntos da lugar a una 
nube de valores que, al igual que ocurría con las semivarianzas, puede emplearse 
para crear una curva experimental y a partir de esta una curva teórica. Con dicha 
curva teórica se tiene conocimiento de la covarianza a cualquier distancia, y recibe 
el nombre de correlograma. 


Existe una relación directa entre el variograma y el correlagrama, como puede 
verse en la figura 12.11. Con la notación de la figura, se tiene para el caso del 
variograma que 



Í= 1 


(12.5.14) 


Sij = (xi-x)(xj-y) 


(12.5.15) 



Figura 12.11: Relación entre correlograma (a) y variograma (b) 



(12.5.16) 


Para el correlograma, se tiene que 



(12.5.17) 


En la práctica, se emplea el variograma porque resulta más sencillo modelizar 
las semivarianzas que las covarianzas. 

12.6. Resumen 

Los datos espaciales presentan particularidades que deben considerarse a la 
hora de realizar cálculos estadísticos sobre ellos. Teniendo esto en cuenta, existen 
muy diversas formas llevar a cabo el análisis estadístico de datos espaciales, de 
las cuales hemos visto algunas de las más importantes 

Los elementos básicos de estadística descriptiva para datos espaciales son el 
centro medio, el centro mediano y la distancia típica. La elipse de variación permite 
representar gráficamente la dispersión, considerando que esta no se da igual en 
todas direcciones. 

En el caso de trabajar con líneas y las direcciones que estas definen, es im- 
portante tener en cuenta la naturaleza circular de las variables. El trabajo con 
vectores en lugar de valores escalares es una solución práctica habitual para evitar 
resultados incorrectos. 

Otro elemento importante del análisis estadístico espacial es el análisis de 
patrones de puntos. El método de división por cuadrantes, el de vecino más cercano, 
o el basado en funciones K de Ripley, todos ellos permiten caracterizar la disposición 
espacial de los puntos y con ello el proceso puntual inherente que da lugar a la misma. 

Por último, la existencia de autocorrelación espacial puede medirse con índices 
como el I de Moran o el c de Geary, así como analizarse a través de variogramas. 
A partir de los datos de las semivarianzas se elabora un variograma experimental, 
el cual sirve como base para el ajuste de un variograma teórico. Este puede puede 
emplearse posteriormente en otras técnicas tales como el kriging, que veremos más 
adelante. 
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Capítulo 13 


Creación de capas ráster 


El formato ráster es la base para un gran numero de algoritmos de análisis. No obstante, 
una buena parte de los métodos de obtención de información geográfica no generan capas 
ráster con una estructura regular, sino información distribuida de forma irregular. La 
creación de una estructura regular a partir de datos irregularmente distribuidos se lleva 
a cabo mediante métodos diversos, entre los cuales tienen especial presencia los métodos 
de interpolación. 

En este capitulo estudiaremos estos métodos, tanto aquellos que utilizan exclusivamen- 
te la variable a interpolar como aquellos que se basan en métodos estadísticos y permiten 
la incorporación de variables de apoyo. Por último, veremos cómo utilizar la información 
tomada en puntos aislados para generar capas ráster de densidad. Con todo ello, sentaremos 
la base para la creación de capas ráster a partir de información vectorial. 

Para seguir el capítulo debes dominar los conceptos básicos de la estadística espacial 
(Capítulo 12), así como de estadística general, pues ambas se usan con cierta profundidad 
en gran parte de los desarrollos a tratar. 


13.1. Introducción 

Una buena parte de los análisis geográficos se realizan sobre capas en formato 
ráster. Estas, por sus propias características, se prestan mejor a cierto tipo de 
análisis, y la implementación de estos resulta más sencilla, por lo que lo habitual 
es encontrarlos implementados para ser empleados con capas ráster. 

La información de la que disponemos no siempre se encuentra en este for- 
mato, pero ello no significa necesariamente que no podamos utilizarla. A partir 
de información en otros formatos podemos generar capas ráster (este proceso lo 
denominaremos rasterización ) que reúnan las características para ser analizadas 
mediante dichos algoritmos. El problema es en todos los casos la creación de una 
estructura regular a partir de información que no es regular, tal como la contenida 
en un TIN, una capa de polígonos, una de líneas, o una capa de valores puntuales. 

Si disponemos de una capa de polígonos y estos cubren la totalidad del territo- 
rio, este proceso no es difícil. Basta ver dentro de qué polígono cae la coordenada 
que define cada celda, y asignar a esta el valor de uno de los atributos de la capa de 
polígonos, el cual contenga la variable a recoger en la capa ráster 1 . En el caso del 


1 En realidad, y aunque esta sea una manera sencilla de rasterizar unos polígonos, operando de 
este modo el rendimiento que se obtendría sería insuficiente, ya que el número de celdas a comprobar 
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TIN es similar, ya que cada uno de los triángulos permite el cálculo de valores en 
sus puntos, y puede igualmente establecerse una relación entre estos y las celdas 
de una malla ráster que cubra el mismo espacio geográfico. 

Si tenemos una capa de líneas la cosa no es muy distinta. Basta ver por qué 
celdas pasan esas líneas y asignar el valor de estas a dichas celdas. Pueden existir 
ambigüedades a la hora de considerar cuánto ha de recorrer una linea a través de 
una celda para considerar que pasa por esta y asignarle el valor correspondientes, 
como se muestra en la figura 13.1. No obstante, y salvando estos aspectos, no 
resulta difícil rasterizar una capa de líneas y tener una capa ráster válida. 




Figura 13.1: Formas distintas de rasterizar una línea en función del criterio empleado. 

Por último, para el caso de una capa de puntos, la conversión en una capa ráster 
es aún más sencilla. Basta con asignar los correspondientes valores a aquellas celdas 
en las que se sitúen los puntos. Las restantes, y puesto que no existe información 
al respecto, deberán llevar el valor que codifica la ausencia de datos. 

Sin embargo, estas formas de rasterización pueden no ser idóneas según las 
circunstancias. En los dos últimos casos (líneas y puntos), y especialmente para 
el caso de puntos, la situación que se recoge en la capa ráster puede no ser la 
óptima para el análisis, y realmente no estaremos aprovechando las capacidades 
del modelo de datos ráster a pesar de haber llevado a cabo una conversión. 

Por ejemplo, si las líneas que rasterizamos son curvas de nivel, van a indicar 
la elevación en las mismas. Fuera de ellas, la capa ráster generada no tendrá datos, 
pero en realidad esas celdas sí que tienen una elevación concreta. Del mismo modo 
sucede si medimos esa elevación en una serie de puntos en lugar de en líneas y 
después rasterizamos la capa, o si medimos cualquier otra variable en un número 
dado de localizaciones puntuales y hacemos lo propio. 

es muy elevado. Existen otro tipo de algoritmos, denominados de barrido, que resultan más eficaces, 
aunque no los detallaremos aquí. Estos algoritmos no tiene en su origen ninguna relación con un 
SIG, sino con la mera representación gráfica. Piensa que la pantalla de tu ordenador es como una 
capa ráster, formada por una malla de pequeños puntos de luz, y representar todo polígono en ella 
requiere en primer lugar expresar ese polígono en la forma en la que la estructura de la pantalla lo 
requiere. En [174] puedes encontrar más información al respecto, así como en la dirección Web [175] . 
Para el caso de la rasterización de líneas, una referencia fundamental es [176] 
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Para aprovechar la buena disposición del modelo ráster para el análisis, y 
especialmente en el caso de variables continuas, debemos tener una capa que 
contenga información en todas sus celdas, incluso si originalmente solo hemos 
medido los valores de la variable estudiada en una serie de celdas. Será en base a los 
valores de esas celdas como obtengamos posteriormente los valores en las restantes. 

Los métodos de interpolación que veremos en este capítulo permiten rellenar 
esas celdas restantes a partir de los valores puntuales conocidos, realizando estima- 
ciones. Para ello, aplican conceptos de estadística espacial más o menos complejos 
según su formulación particular, de tal modo que los puntos cercanos a cada celda 
son los que determinan el valor estimado de esta. Este hecho es una aplicación 
directa de la ley de Tobler, que establece que los puntos cercanos tiene mayor proba- 
bilidad de tener valores similares que aquellos separados por una distancia mayor. 

En términos generales, un método de interpolación es una herramienta que per- 
mite el cálculo del valor de una variable en una coordenada para la cual dicho valor 
no es conocido, a partir de los valores conocidos para otra serie de coordenadas. En 
el caso particular de la creación de una capa ráster, las coordenadas (x,y) donde han 
de calcularse los valores desconocidos son los centros de las celdas sin dato recogido. 

El número de métodos distintos es muy amplio, y es importante reseñar que 
la bondad o no de uno u otro va ligada no solo al método en sí, sino también a la 
variable interpolada y al uso que se dé posteriormente a la capa resultante. 

La aplicación de los métodos de interpolación es, asimismo, muy diversa. Casos 
habituales son, por ejemplo, la realizada a partir de datos de elevación tomados en 
campo mediante GPS o estación total, o de los datos climatológicos de precipitación 
y temperatura registrados en los observatorios de una red. Resulta imposible recoger 
valores para cada una de las celdas de una capa ráster que cubra el territorio a 
estudiar, pero estas variables, por ser continuas, se manejarán mejor y serán más 
útiles si se dispone de ellas en formato ráster. Los métodos de interpolación son 
los encargados de convertir esos datos puntuales en mallas regulares. 

Otro ejemplo claro es la realización de calicatas para la medida de las propieda- 
des del suelo tales como porcentajes de arcilla o limo. Resulta de igual modo inviable 
muestrear todo el suelo, pero tomando un numero dado de muestras puede crearse 
una capa ráster de toda una zona a través del uso de métodos de interpolación. 

En general, cualquier variable recogida mediante maestreo puede ser el punto 
de partida para la aplicación de dichos métodos. 

En algunos de los casos anteriores, los valores en las celdas guardan una depen- 
dencia no solo con los puntos que contienen la variable interpolada, sino también con 
otras variables de las que puede o no disponerse de información. Por ejemplo, para 
el caso de la temperatura, esta se encuentra influenciada por la elevación. De igual 
modo, las características del suelo tendrán relación con parámetros del relieve tales 
como la pendiente o índices relacionados con la humedad topográfica (Capítulo 15) . 

Estas variables, que denominamos variables de apoyo o predictores, puede incor- 
porarse como datos de partida a algunos métodos de interpolación, aumentando así 
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su precisión. En general, se requiere que dichas variables de apoyo estén recogidas en 
formato ráster. Asimismo, pueden plantearse análisis de regresión mediante los cua- 
les, y sin necesidad de utilizar la componente espacial, puedan estimarse los valores 
en las celdas problema a partir de los valores de la variable en los puntos conocidos 
y los valores de los predictores tanto en dichos puntos como en las celdas a rellenar. 

Junto con lo anterior, la información de una determinada variable cuantitativa 
tomada en ciertos puntos puede servir para estimar densidades de dicha variable 
(tales como, por ejemplo, individuos de una especie) y crear superficie continuas. 
Este análisis se lleva a cabo no con métodos de interpolación o regresión, sino con 
otra serie de algoritmos habituales en los SIG que veremos al final del capítulo. 


13.2. Interpolación 

Un método de interpolación permite el calculo de valores en puntos no rnues- 
treados, a partir de los valores recogidos en otra serie de puntos. 

Supongamos el siguiente ejemplo sencillo: 









10 

• 




10,2 

• 









? 





• 

10,3 




10,9 








Los cuatro puntos señalados han sido muestreados y se dispone de un valor 
en ellos. Adviértase que no han de encontrarse necesariamente en el centro de las 
celdas. Queremos estimar los valores en las celdas de la malla, en particular en 
la celda marcada con un interrogante. 

La lógica nos indica que el valor en esta celda debe estar alrededor de 10, ya que 
este valor sigue la tendencia natural de los valores recogidos, que tiene todos ellos 
un valor de esa magnitud. Si aplicamos cualquiera de los métodos de interpolación 
que veremos a continuación, el valor que obtengamos será con seguridad muy 
aproximado a esa cifra. 

Otro ejemplo sería el siguiente: 
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En este caso, la lógica nos indica que el valorá ser inferior a 10, y también proba- 
blemente a la media de los valores muéstrales (9), ya que la celda problema se sitúa 
más cerca de los valores inferiores que de los superiores a ese valor medio. Razonan- 
do de este modo, aplicamos el hecho de que la proximidad incrementa la semejanza 
de valores. Es decir, que existe autocorrelación espacial para la variable interpolada. 

El caso siguiente ya es algo distinto: 









18 

• 
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• 
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• 

2 




9 








En este caso, no parece tan sencillo «adivinar» el valor que corresponde. Esto 
es así no porque las operaciones sean más complejas, sino porque no existe de 
la misma forma que en los ejemplos anteriores la autocorrelación espacial de la 
variable, y esa lógica no resulta tan obvia. Utilizando los distintos métodos de 
interpolación, puede ser que estos den valores distintos, ya que se comportarán 
de forma diferente ante tal situación. 

Estos sencillos ejemplos numéricos tienen como objetivo el dar otra imagen 
distinta de lo que el proceso de interpolación conlleva, y que puede resultar más 
intuitivo al analizarlo sobre un conjunto reducido de puntos. A pesar de sus di- 
ferencias, grandes en muchos casos, todos parten de ideas comunes que lo único 
que pretenden es replicar de forma lo más precisa posible un campo a partir de 
un conjunto definido de puntos con valores de este. 

Existen muchos métodos de interpolación, de los cuales algunos cuentan con 
más presencia en los SIG por estar más adaptados al tipo de dato que se maneja. Su 
aplicación habitual dentro de un SIG es bidimensional, ya que una capa ráster es una 
entidad bidimensional. Hablamos, por ello, de interpolación espacial. No obstante, 
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estos métodos no han de restringirse al plano, y pueden extenderse a un numero 
superior de dimensiones para reflejar otras variables tales como la profundidad (por 
ejemplo, para construir un modelo tridimensional de las características del suelo 
entre dos profundidades establecidas y con un intervalo dado), o bien el tiempo. 

Podemos clasificar los distintos métodos de interpolación según varios criterios 
[177]. 

■ Según los puntos considerados para el cálculo de valores. Algunos 
métodos consideran que todos los puntos de los que disponemos tienen 
influencia sobre el valor a calcular en una celda. Estos modelos se conocen 
como globales. En otros, denominados locales , solo se considera un conjunto 
restringido de estos. Este conjunto puede establecerse por medio de un 
umbral de distancia (todos los situados a una distancia menor que el umbral) , 
de conteo (los n puntos más cercanos), o bien ambos. 

La selección de este conjunto de puntos más cercanos (los de más influencia) 
es un aspecto importante en el rendimiento de los métodos de interpolación 
de este tipo. Cuando se trabaja con un número de puntos elevado, se hace 
inviable el cálculo de las distancias entre todos esos puntos para seleccionar 
los más cercanos. El uso de índices espaciales y otras estructuras semejan- 
tes (véase 11.4.2) se hace necesario para poder aplicar eficientemente estos 
métodos de interpolación sobre dichos conjuntos con tal número de puntos. 
En realidad, un método global puede entenderse como uno local con un 
umbral infinito, no existiendo una dicotomía estricta entre ambas clases. 

■ Según su valor en los puntos de partida. En algunos métodos, deno- 
minados exactos , los valores asignados a las coordenadas correspondientes a 
los puntos de origen son exactamente los recogidos en dichos puntos. En los 
métodos aproximados, el valor en esas celdas es el que corresponde al mejor 
ajuste, y no ha de coincidir necesariamente con el valor original. 

■ Según la inclusión o no de elementos probabilísticos. Diferenciamos 
entre métodos estocásticos (aquellos que emplean elementos probabilísticos) 
y métodos determinísticos (aquellos que no los emplean). 

13.2.1. Por vecindad 

El método más sencillo de interpolación es el de vecindad o vecino más cercano. 
En él se asigna directamente a cada celda el valor del punto más cercano. No existe 
formulación matemática que emplee las distancias entre puntos o los valores de 
estos, sino que el valor resultante es sencillamente el del punto más próximo. 

Se trata, por tanto, de un método local, exacto y determinístico. 

El resultado es una capa con saltos abruptos (tanto como lo sean las diferencias 
entre los valores de puntos cercanos), con un aspecto «aterrazado» (Figura 13.2). 
El conjunto de celdas con el mismo valor (dentro de la misma terraza) representa 
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el lugar geométrico de las celdas cuyo punto más cercano de entre los de partida 
es uno dado. 



Figura 13.2: Superficie obtenida mediante interpolación por vecindad. 


La interpolación por vecindad no es adecuada para el trabajo con variables 
continuas, pero sí para variables categóricas. Por ejemplo, para un conjunto de 
puntos cada uno de los cuales esté identificado con un código numérico, la inter- 
polación por vecindad de ese valor da como resultado una capa donde los valores 
de las celdas identifican el punto más cercano. Esto puede utilizarse para calcular 
la influencia de cada uno de ellos en el espacio representado. 

Este tipo de razonamientos ha sido empleado tradicionalmente para calcular 
los denominados polígonos de Thiessen , de uso habitual en el análisis climatológico, 
asociando a cada zona los valores de la estación meteorológica más cercana. Estos 
polígonos de Thiessen conforman una estructura conocida como teselación de Voro- 
noi, que puede también calcularse de forma vectorial, como veremos en el capítulo 
17. La teselación de Voronoi está íntimamente ligada a la denominada triangulación 
de Delaunay, base para la construcción de TIN como en su momento detallaremos. 


13.2.2. Métodos basados en ponderación por distancia 

Los métodos basados en ponderación por distancia son algoritmos de interpola- 
ción de tipo local, aproximados y determinísticos. El valor en una coordenada dada 
se calcula mediante una media ponderada de los puntos de influencia seleccionados 
(bien sea la selección por distancia o por número de estos) . Su expresión es de la 
forma [178] 


318 


Sistemas de Información Geográfica 


2 


EEi Pi*? 
E Up'I 


(13.2.1) 


siendo p% el peso asignado al punto i-ésimo. Este peso puede ser cualquier función 
dependiente de la distancia. 

La función más habitual es la que da lugar al método de ponderación por 
distancia inversa, de la forma 


» = ^ (U.2.2) 

donde el exponente k toma habitualmente el valor 2. 

Otra función habitual es la de la forma 

Pi = e~ kdi (13.2.3) 

así como la que constituye el método de decremento lineal, con la siguiente expresión: 

Pi = (13-2.4) 

^max 

donde k es un parámetro que regula la forma de la función y d m ax la distancia 
máxima de influencia. 

En la figura 13.3 puede verse el efecto del aumento de la distancia sobre los 
pesos asignados según las ecuaciones 13.2.2 y 13.2.4. 



Distancia 


Figura 13.3: Variación del peso asignado en función de la distancia mediante ponderación 
por distancia inversa (trazo punteado) y decremento lineal (trazo continuo) para valores 
k=l, k=2 y k = 3. 


La figura 13.4 muestra la superficie calculada a partir de datos puntuales de 
elevación aplicando el método de ponderación por distancia inversa. 
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Figura 13.4: Superficie obtenidas mediante ponderación por distancia inversa 


Los métodos basados en ponderación por distancia solo tienen en cuenta el 
alejamiento, pero no la posición. Es decir, un punto situado a una distancia d hacia 
el Norte tiene la misma influencia que uno situado a esa misma distancia d pero 
hacia el Oeste. 

Igualmente, los métodos basados en distancia no generan valores que se en- 
cuentren fuera del rango de valores de los datos de entrada. Eso causa efectos 
indeseados en caso de que el muestro de datos no recoja los puntos característicos de 
la superficie interpolada. La figura 13.5 muestra en un caso unidimensional cómo, 
de no recogerse los valores extremos (tales como cimas o valles), estos desaparecen 
y son sustituidos por tramos llanos 

Puede entenderse el método de vecino más cercano como un caso particular de 
método ponderado por distancia, en el que se emplea un único punto de influencia, 
y su peso asignado es p\ = 1 . 

13.2.3. Ajuste de funciones. Superficies de tendencia 

El ajuste de funciones es un método de interpolación determinístico o estocás- 
tico (según el tipo de función a ajustar), aproximado y global. Puede aplicarse de 
forma local, aunque esto resulta menos habitual. Dado el conjunto completo de los 
puntos de partida, se estima una superficie definida por una función de la forma 

z = f{x,y) (13.2.5) 

El ajuste de la función se realiza por mínimos cuadrados. 

Estas funciones son de tipo polinómico, y permiten el cálculo de parámetros 
en todas las celdas de la capa ráster. Por su propia construcción, requieren pocas 
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Figura 13.5: La interpolación basada en ponderación por distancia (a) no crea valores 
extremos si estos no han sido recogidos, lo cual deriva en un «aplanamiento» de la 
superficie y la aparición de falsas terrazas. Otros métodos tales como los splines (b) sí 
que permiten la aparición de valores fuera del rango muestreado. 

operaciones y son rápidos de calcular. Sin embargo, esta sencillez es también su 
principal inconveniente. Los polinomios de grado cero (plano constante), uno 
(plano inclinado), dos (colina o depresión) o tres, son todos ellos demasiado simples, 
y las variables continuas que pueden requerir un proceso de interpolación dentro 
de un SIG son por lo general mucho más complejas. Pueden emplearse polinomios 
de mayor grado que aumentan la precisión del ajuste en los puntos de partida. Sin 
embargo, aumenta por igual la oscilación de la función entre puntos, mostrando 
un mal comportamiento con grados elevados, y no obteniéndose en ningún caso 
la fidelidad a la superficie real que se logra con otros métodos.. 

La figura 13.6 muestra superficies con valores de elevación obtenidos mediante 
ajuste polinómico de grados dos y cinco. 



Figura 13.6: Superficies obtenidas mediante interpolación por ajuste polinómico de 
segundo (a) y quinto (b) grado. 

El empleo de funciones de ajuste permite incorporar otras variables adicionales 
hi mediante funciones de la forma 
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z=f{x,y,hi,-,h n ) (13.2.6) 

Esto posibilita la incorporación de variables de apoyo (predictores) que pueden 
tener una influencia en la variable interpolada, considerando así no únicamente 
la posición de los distintos puntos, sino los valores en ellos de dichas variables 
de apoyo. Para todas las celdas a rellenar, se dispone de sus coordenadas (x,y), 
que son las del centro de la celda. Si se añaden variables de apoyo, es necesario 
conocer los valores de estas variables también en todas las celdas, para de este 
modo aplicar la función estimada. Por ello, estas variables de apoyo tienen que 
encontrarse igualmente en formato ráster. 

Si bien en muchos casos la superficie interpolada puede no reflejar con precisión 
una variable, puede emplearse para considerar el efecto de tendencias globales en la 
distribución de esta. Una variable puede estar condicionada por efectos globales y 
efectos locales. Puesto que el ajuste de una función polinómica tal y como lo hemos 
visto aquí es un interpolador global, permite la separación de estos dos tipos de efec- 
tos. Este proceso constituye el empleo de las denominadas superficies de tendencia. 

Supongamos una capa de temperatura. Esta dependerá de la altura, pero tam- 
bién de la latitud. Existe, por tanto, una tendencia global: a mayor latitud (supónga- 
se hemisferio norte), menor temperatura. Esta se puede modelizar con una función 
lineal, y separar el efecto de ambos factores, altitud y latitud (Figura 13.7). El efecto 
local puede entenderse como el residuo de primer orden de la superficie interpolada. 



Figura 13.7: Separación de una variable en un un efecto debido a una tendencia geográfica 
(en este caso en forma de plano inclinado con valores mayores la zona este) y un efecto local 

En la aplicación de predictores debe tenerse en cuenta el principio de parsimonia: 
mantener el modelo lo más simple posible. La incorporación de nuevos predictores, 
si estos se encuentran significativamente correlacionados, conlleva un aumento 
de la multicolinearidad [179]. Esta circunstancia da lugar a un sobreajuste de la 
función y empeora la calidad de las estimaciones, especialmente en la predicción de 
datos fuera del área delimitada por los puntos de partida, es decir, la extrapolación. 

Un caso particular de las funciones del tipo señalado en la ecuación 13.2.6 son 
las de la forma 


z = f(hi,...,h n ) 


(13.2.7) 
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es decir, aquellas que no consideran la componente geográfica y simplemente 
realizan una regresión en el espacio de atributos. 

Puesto que existe autocorrelación espacial, en el caso de considerar el espacio 
geográfico resulta más conveniente el uso de mínimos cuadrados generalizados en 
lugar de mínimos cuadrados ordinarios. En el capítulo 20 veremos con más detalle 
los temas relacionados con regresiones e inferencia estadística basada en datos 
espaciales. 

13.2.4. Curvas adaptativas (Splines) 

Las curvas adaptativas o splines conforman una familia de métodos de inter- 
polación exactos, determinísticos y locales. Desde un punto de vista físico pueden 
asemejarse a situar una superficie elástica sobre el área a interpolar, fijando esta 
sobre los puntos conocidos. Crean así superficies suaves, cuyas características pue- 
den regularse modificando el tipo de curva empleada o los parámetros de esta, de la 
misma forma que sucedería si se variasen las cualidades de esa membrana ficticia. 

La superficie creada cumple la condición de minimizar con carácter global 
alguna propiedad tal como la curvatura. 

Desde un punto de vista matemático, los splines son funciones polinómicas 
por tramos, de tal modo que en lugar de emplear un único polinomio para ajustar 
a todo un intervalo, se emplea uno distinto de ellos para cada tramo. Las curvas 
definidas por estos polinomios se enlazan entre ellas en los denominados nudos , 
cumpliendo unas condiciones particulares de continuidad. 

Los splines no sufren los principales defectos de los dos métodos anteriores. Por 
un lado, pueden alcanzar valores fuera del rango definido por los puntos de partida. 
Por otro, el mal comportamiento de las funciones polinómicas entre puntos se evita 
incluso al utilizar polinomios de grados elevados. No obstante, en zonas con cambios 
bruscos de valores (como por ejemplo, dos puntos de entrada cercanos pero con 
valores muy diferentes), pueden presentarse oscilaciones artificiales significativas. 
Para solucionar este problema, una solución es el empleo de splines con tensión 
[180]. La incorporación de la tensión en una dirección permite añadir anisotropía 
al proceso de interpolación [181]. 

La figura 13.8 muestra una superficie calculada mediante interpolación con 
splines. 

13.2.5. Kriging 

El kriging 2 es un método de interpolación estocástico, exacto, aplicable tanto 
de forma global como local. Se trata de un método complejo con una fuerte carga 
(geo-) estadística, del que existen además diversas variantes. 

2 Krigeage en su denominación original en francés, que se traduce como krigeado en castellano, 
aunque es mucho más habitual el uso de la denominación inglesa, la cual emplearemos aquí. 
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Figura 13.8: Superficie obtenida mediante interpolación con splines. 


El kriging se basa en la teoría de variables regionalizadas, la cual fue desarrolla- 
da por [182] a partir del trabajo pionero de [183]. El objetivo del método es ofrecer 
una forma objetiva de establecer la ponderación óptima entre los puntos en un 
interpolador local. Tal interpolación óptima debe cumplir los siguientes requisitos, 
que son cubiertos por el kriging: 

■ El error de predicción debe ser mínimo. 

■ Los puntos cercanos deben tener pesos mayores que los lejanos. 

■ La presencia de un punto cercano en una dirección dada debe restar influencia 
(enmascarar) a puntos en la misma dirección pero más lejanos. 

■ Puntos muy cercanos con valores muy similares deben «agruparse», de tal 
forma que no aparezca sesgo por sobremuestreo. 

■ La estimación del error debe hacerse en función de la estructura de los puntos, 
no de los valores. 

Junto con la superficie interpolada, el kriging genera asimismo superficies con 
medidas del error de interpolación, que pueden emplearse para conocer la bondad 
de esta en las distintas zonas. 

En su expresión fundamental, el kriging es semejante a un método basado en 
ponderación por distancia. Dicha expresión es de la forma 


siendo A ¿ los pesos asignados a cada uno de los puntos considerados. El cálculo de 
estos pesos, no obstante, se realiza de forma más compleja que en la ponderación 
por distancia, ya que en lugar de utilizar dichas distancias se acude al análisis de 


n 



(13.2.8) 


i — 1 
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la autocorrelación a través del variograma teórico (12.5.3). Por ello se requiere, 
asimismo, que exista un número suficiente de puntos (mayor de 50, como se vio 
en el capítulo 12) para estimar correctamente el variograma. 

A partir de los valores del variograma, se estima un vector de pesos que, 
multiplicado por el vector de valores de los puntos de influencia, da el valor estimado. 

En el denominado kriging ordinario , e interpolando para un punto p empleando 
n puntos de influencia alrededor de este, el antedicho vector de pesos se calcula según 
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(13.2.9) 


siendo dij la distancia entre los puntos i y j , y A un multiplicador de Lagrange. 

El error esperado en la estimación también se obtiene, como se dijo antes, a 
partir de la estructura de los puntos. Es decir, utilizando igualmente el variograma. 
Para ello se emplean los pesos calculados anteriormente, según 


n 

Sp = Y, w ^( d i P ) + * (13.2.10) 

2=1 

La aplicación del kriging ordinario implica la asunción de una serie de carac- 
terísticas de los datos: 

■ Estacionar idad de primer y segundo orden. La media y la varianza son cons- 
tantes a lo largo del área interpolada, y la covarianza depende únicamente 
de la distancia entre puntos. 

■ Normalidad de la variable interpolada. 

■ Existencia de una autocorrelación significativa. 

La figura 13.9 muestra una superficie obtenida mediante kriging ordinario, 
junto a la capa de varianzas asociada. 

Cuando no puede asumirse la estacionariedad de primer orden y existen una 
tendencia marcada en el valor medio esperado en los distintos puntos, puede 
aplicarse un tipo de kriging denominado kriging universal. Además de los valo- 
res a interpolar y sus coordenadas, este método permite el uso de predictores 
relacionados con dicha tendencia. 

El kriging con regresión es similar en cuanto a sus resultados e ideas, aunque 
la forma de proceder es distinta. Mientras que en el universal se trabaja con los 
residuos y la superficie de tendencia conjuntamente, este separa ambas partes y 
las analiza por separado, combinándolas después para estimar los valores y los 
errores asociados. 

Existen muchas otras variaciones del kriging tales como el kriging simple , el 
kriging por bloques o el co-kriging. La aplicación de los mismos, no obstante, es 
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a) b) 


Figura 13.9: Superficie obtenida mediante interpolación por kriging ordinario y capa 
de varianzas. Nótese que, para lograr una representación visual mejor, la vista 3D tiene 
una orientación contraria a la vista 2D. 


restringida debido a que no es tan frecuente su implementación. Los SIG habitua- 
les implementan por regla general las variantes básicas anteriores, quedando las 
restantes para programas mucho más especializados. 

13.2.6. Muestreo de datos para interpolación 

Muchas veces, la información de la que disponemos la obtenemos de una fuente 
ajena y no queda más remedio que emplearla tal y como la recibimos. Tal es el caso 
de una curvas de nivel digitalizadas de un mapa clásico (no podemos disponer de 
más curvas porque no existen en el mapa original) , o de unos datos de observatorios 
meteorológicos (no podemos densificar esa red y disponer de datos medidos en 
otros puntos). 

En otras ocasiones, sin embargo, los datos pueden no haber sido tomados aún y 
debe plantearse un esquema para ello. Es decir, que ese conjunto finito de puntos a 
partir de los cuales obtener una superficie interpolada puede ser creado a voluntad, 
siempre que nos mantengamos dentro del marco de limitaciones (temporales, 
monetarias, etc.) existentes. El diseño del muestreo de forma eficiente ayuda de 
forma directa a obtener mejores resultados al interpolar los datos recogidos. Este 
diseño de muestreo puede realizarse no solo para obtener un conjunto de datos 
base, sino para enriquecer uno ya existente, ampliándolo con nuevos puntos. 

El objetivo de un muestreo espacial es poder inferir nueva información acerca 
de una población en la que sus distintos elementos están georreferenciados, a partir 
de un subconjunto de dicha población. La razón de llevar a cabo el muestreo es la 
imposibilidad de analizar todos los miembros de la población, ya que estos pueden 
ser muy numerosos (como en el caso de todos los habitantes de un país) o infinitos 
(como sucede para variables continuas tales como elevaciones o temperaturas). 
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Aunque el uso de un muestreo no es exclusivamente la interpolación posterior de 
sus datos para obtener una superficie continua, sí que es cierto que la interpolación 
se ha de basar en un muestreo previo, por lo que ambos conceptos van íntimamente 
unidos. Por ello, analizaremos en esta sección algunas de las ideas fundamentales 
que deben conocerse para diseñar un muestreo, y que directamente condicionan 
la calidad de la interpolación aplicada sobre el conjunto de puntos muestreados. 

Lógicamente, el trabajar con una fracción reducida de la población introduce 
un cierto nivel de error. Ese error puede controlarse y acotarse mediante el di- 
seño del muestreo. Por ello, a la hora de diseñar un muestreo deben plantearse 
principalmente las siguientes preguntas [119]: 

■ ¿Qué se pretende estimar? Algunas propiedades no poseen componente 
espacial, y lo importante es el cuánto , no el dónde. Por ejemplo, la media 
de una variable. En el caso de la interpolación, sí es de gran importancia el 
dónde, puesto que, como ya sabemos, existe autocorrelación espacial y esta es 
utilizada como concepto inherente a los distintos métodos de interpolación. 

■ ¿Que tamaño de muestreo (número n de muestras) se necesita para un nivel 
de precisión dado? El error esta acotado en función de los puntos muéstrales. 
En algunos casos se necesita realizar una estimación con un alto grado de 
precisión, y dentro de un amplio intervalo de confianza. En otros, sin embargo, 
no es necesario, y plantear un muestreo demasiado amplio supone un gasto 
innecesario de recursos. 

■ ¿Dónde tomar esas n muestras? Por la existencia de autocorrelación espacial 
o por la variación espacial que pueden presentar otras variables relacionadas, 
una de las partes más importantes del muestreo es determinar la localiza- 
ción exacta en la que tomar las muestras. Existen tres modelos básicos de 
muestreo: aleatorio, estratificado y regular (Figura 13.10) 





a) 


b) 


c) 


Figura 13.10: Tipos de muestreo. a) regular, b) aleatorio, c) estratificado 

El muestreo aleatorio simplemente sitúa los puntos de muestreo al azar sin 
obedecer a ningún condición particular. Si se desconoce el comportamiento 
de la variable muestreada, un muestreo aleatorio puede ser una buena opción. 
El muestreo regular sitúa puntos a intervalos fijos, constituyendo lo que se 
conoce como una malla de muestreo. 
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Por último, el muestreo estratificado requiere la presencia de una variable 
adicional relacionada. Si esta variable se encuentra zonificada, podemos 
subdividir el muestreo haciendo uso de las distintas zonas. Por ejemplo, si 
muestreamos una serie de parcelas donde estudiamos la altura media de sus ár- 
boles y disponemos de información sobre el tipo de suelo, podemos muestrear 
por separado para los distintas clases de suelo, ya que este tiene influencia so- 
bre el crecimiento de los pies. Esto aumenta la precisión del muestreo, ya que 
en lugar de una única población heterogénea, se tienen un numero de subpo- 
blaciones más homogéneas, en virtud de la agrupación según un factor común. 
Los diseños pueden combinarse para obtener resultados más satisfactorios. 
Por ejemplo, puede hacerse un diseño estratificado y en cada uno de los 
estratos (cada zona definida por la variable adicional) plantear un muestreo 
regular con un tamaño particular de malla o incluso con un número de puntos 
a muestrear distinto en cada estrato. 

Aplicando conjuntamente todo lo anterior debe tratar de diseñarse un muestreo 
que cumpla con lo siguiente: 

■ Explicar la variabilidad de la variable lo mejor posible. Por ejemplo, en el 
caso de plantear un muestreo que complemente a uno previo, ya se dispone 
de información acerca de la variable muestreada. Esta puede emplearse para 
distribuir adecuadamente los nuevos puntos de muestreo, aplicando que, por 
ejemplo, se necesitan más muestras en zonas de alta variabilidad. 

El empleo de los denominados muéstreos pilotos es una herramienta para 
conocer en primera aproximación las propiedades de la variable a estudiar 
y diseñar el muestreo acorde con estas. 

■ Ser representativa. Esta representatividad debe ser tanto en el espacio de 
atributos como en el espacio geográfico, según puede verse en la figura 13.11 




Figura 13.11: El muestreo a) es representativo en el espacio de atributos pero no en 
el geográfico. El b), sin embargo, es representativo en el espacio geográfico pero no en 
el de atributos. 

Esta figura muestra también algunas de las principales debilidades que pueden 
encontrarse en los distintos métodos de diseño de muestreo. Si la variable exhibe 
un comportamiento periódico, un muestreo regular puede enmascarar la existencia 
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de dicha periodicidad y no ser representativo en el espacio de atributos. Ese es el 
caso del ejemplo a). En general, si existe algún tipo de orden oculto en la variable 
a analizar, debe tenerse cuidado a la hora de emplear muéstreos sistemáticos, 
para evitar estos fenómenos. En el caso de ejemplo a), aunque no es un muestreo 
sistemático, la estructura de los puntos muéstrales es bastante regular, lo que 
provoca que no se obtenga la representatividad en el espacio de atributos, dada 
la estructura periódica de la variable en el eje x. 

En el ejemplo b) el muestreo no es representativo del espacio geográfico ya que 
el diseño deja grandes áreas sin ser muestreadas. Esto puede suceder al emplear 
muéstreos aleatorios, ya que estos, por su propia aleatoriedad, pueden generar 
estructuras que dejen amplias zonas sin ser muestreadas o con una intensidad de 
muestreo insuficiente. 

13.2.7. Elección del método adecuado 

Junto a los métodos de interpolación que hemos visto, que son los más comunes 
y los implementados habitualmente, existen otros muchos que aparecen en determi- 
nados SIG tales como los de vecino natural [184], interpolación picnofiláctica [185], 
u otros. Además de esto, cada uno de dichos métodos presenta a su vez diversas 
variantes, con lo cual el conjunto global de metodologías es realmente extenso. A 
partir de un juego de datos distribuidos irregularmente, la creación de una malla 
ráster regular es, pues, una tarea compleja que requiere para empezar la elección 
de un método concreto. Este proceso de elección no es en absoluto sencillo. 

No existe un método universalmente establecido como más adecuado en todas 
situaciones, y la elección se ha de fundamentar en diversos factores. Al mismo 
tiempo, un método puede ofrecer resultados muy distintos en función de los pa- 
rámetros de ajuste, con lo que no solo se ha de elegir el método adecuado, sino 
también la forma de usarlo. Entre los factores a tener en cuenta para llevar esto 
a cabo, merecen mencionarse los siguientes: 

■ Las características de la variable a interpolar. En función del signifi- 
cado de la variable, las características de un método pueden ser adecuadas 
o no. Si, por ejemplo, interpolamos valores de precipitación máxima anual, 
no es adecuado utilizar aquellos métodos que suavicen excesivamente la 
superficie resultante, ya que se estarían perdiendo los valores extremos que, 
por la naturaleza del valor interpolado, son de gran interés. 

■ Las características de la superficie a interpolar. Si conocemos a priori 
algunas características adicionales de la superficie resultante, algunos mé- 
todos permiten la incorporación de estas características. Por ejemplo, varia- 
ciones bruscas en puntos de discontinuidad tales como acantilados en el caso 
de interpolar elevaciones, son aplicables mediante la imposición de barreras 
con métodos como el de distancia inversa, pero no con otros como el kriging. 

■ La calidad de los datos de partida. Cuando los datos de partida son 
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de gran precisión, los métodos exactos pueden tener más interés, de cara a 
preservar la información original. Si, por el contrario, sabemos que los datos 
de partida contienen mucho ruido, aquellos métodos que suavizan el resultado 
tal como el kriging son preferibles, de cara a atenuar el efecto de dicho ruido. 

■ El rendimiento de los algoritmos. Algunos algoritmos como los basados 
en distancia son rápidos y requieren un tiempo de proceso aceptable incluso 
en conjuntos de datos de gran tamaño. Otros, como el kriging, son mucho más 
complejos y el tiempo de proceso es elevado. A esto hay que sumar la configura- 
ción propia del método, con lo que crear una capa ráster con algunos métodos 
puede llevar mucho más tiempo que con otros y requerir un esfuerzo mayor. 

■ El conocimiento de los métodos. Por obvio que parezca, debe conocerse 
bien el significado del método para poder aplicarlo. Un método de gran com- 
plejidad como el kriging exige una solida base de conceptos geoestadísticos 
para su aplicación. Más aún, el elevado número de ajustes que requiere y la 
alta sensibilidad del método a la variación de estos valores refuerza lo anterior. 
La figura 13.12 muestra tres capas interpoladas mediante kriging a par- 
tir de un conjunto de puntos. El empleo de distintos ajustes y variogra- 
mas(lógicamente, no todos correctos) da lugar a capas completamente di- 
ferentes. Si no se emplea correctamente, un método de interpolación puede 
producir resultados carentes de sentido, que aunque dan lugar a una capa 
con datos en todas sus celdas, dichos datos pueden no ser adecuados. 



Figura 13.12: Distintos resutlados obtenidos por kriging a partir de un mismo juego 
de puntos, utilizando diferentes ajustes. 

Pese a lo anterior, el kriging es utilizado habitualmente sin considerar estos 
aspectos, obteniéndose resultados aparentemente correctos pero con frecuen- 
cia erróneos. La experiencia del usuario es un elemento clave en la aplicación 
de métodos de interpolación, y debe ponerse gran énfasis en este aspecto. 
No debe olvidarse tampoco que algunos métodos asumen que se dan ciertas 
condiciones de los datos de partida, y esto puede no ser cierto, o bien reque- 
rirse algún tipo de transformación para que así suceda. Es necesario siempre 
comprobar que se dan estos supuestos. 

■ El uso de la capa resultante. No es lo mismo utilizar un MDE para crear 




330 


Sistemas de Información Geográfica 


una vista 3D con una fotografía aérea, que emplearlo para crear una ortofoto. 
Los requerimientos de calidad en el primer caso son menores, tan solo de 
tipo visual, y cualquiera de los métodos puede sernos válido. Aplicar una 
metodología compleja y laboriosa como el kriging quizás no sea la mejor 
opción en este caso, y sí lo sea el empleo de una ponderación por distancia. 


13.2.8. Elección de las características de la capa resultante 

Los métodos que hemos visto en este capítulo no imponen restricciones sobre 
la distribución o el número puntos de entrada (si bien el kriging, por ejemplo, 
exige un cierto número de puntos para un ajuste fiable del variograma teórico), 
ni tampoco sobre las características de la capa ráster resultante. No obstante, 
resulta claro que existe una relación directa entre ambas, y que la capacidad de 
un conjunto de valores puntuales para generar una capa ráster es limitada. 

En la práctica, a partir de cualquier capa de puntos podemos obtener cualquier 
capa ráster, ya que pueden siempre calcularse los valores en las celdas. Si aplicamos 
algunos conceptos cartográficos e ideas básicas de teoría de la información, esto 
es, no obstante, incorrecto, existiendo unas características idóneas para la capa 
ráster interpolada, fuera de las cuales no es adecuado interpolar. 

Vimos en 5.3.1 que la resolución horizontal o tamaño de celda era uno de los 
parámetros básicos que definían las características de una capa ráster. Existiendo 
relación entre los puntos de origen y la capa interpolada a partir de ellos, debe 
existir por igual una relación entre la distribución espacial de los valor puntuales 
y dicho tamaño de celda, pues ambos elementos definen la precisión con que se 
recoge la variable estudiada. 

Cuando el número de puntos no es suficiente para ello, crear una capa con una 
resolución alta (tamaño de celda pequeño) equivale a generar un resultado cartográ- 
ficamente incorrecto. Por el contrario, interpolar con un tamaño de celda demasiado 
grande supone estar «desperdiciando» parte de la información de partida, lo cual, 
en el caso de trabajar sobre un muestreo realizado específicamente para ello, implica 
un malgasto de medios materiales y humanos en la recogida de datos. La elección del 
tamaño de celda adecuado es, por tanto, fundamental en el proceso de interpolación. 

Los conceptos que vamos a ver a este respecto pueden emplearse tanto para 
estimar el tamaño de celda de la capa a interpolar, como para ayudar en el diseño del 
muestro previo a la creación de esta. Así, si conocemos de antemano (por ejemplo, 
por el uso que le vamos a dar) las características de la capa que necesitamos generar, 
podemos diseñar de forma más correcta el muestreo haciendo uso de estas ideas. 

[186] argumenta que el tamaño de celda adecuado de una capa ráster es función 
de la escala, la capacidad de proceso, la precisión posicional, la densidad de mues- 
treo, la correlación espacial existente y la complejidad de la superficie a interpolar. 
Según estos conceptos, define tamaños mínimos y máximos de celda para cada 
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circunstancia y cada factor considerado de los anteriores. Asimismo, recomienda 
una solución de compromiso entre los citados valores extremos. 

Para la densidad de muestreo, se considera que, por ejemplo para la toma de da- 
tos de suelo, por cada centímetro cuadrado del mapa debe existir al menos una mues- 
tra [187] . Aplicando los conceptos que vimos en 3.4, se llega a una resolución óptima 


siendo A el área de la zona a interpolar y IV el número de puntos disponibles. 

Si, en lugar de lo anterior, aplicamos criterios basados en la disposición geo- 
métrica de los puntos, se llega a un valor 


La gran diferencia existente entre este tamaño recomendado y el anterior se 
debe al hecho de que este último es válido únicamente para patrones de puntos com- 
pletamente regulares. En el caso de patrones aleatorios o agregados se deben aplicar 
consideraciones distintas. Por ejemplo, para el caso de un patrón agregado, la dis- 
tancia media entre puntos es aproximadamente la mitad de la existente en un patrón 
regular con el mismo número de puntos. Por ello, la anterior fórmula quedaría como 


Aunque resulta imposible dar una cifra exacta para la resolución óptima con- 
siderando todos los factores implicados, valores recomendados como los anteriores 
son de gran utilidad para poder al menos tener una idea del intervalo en el que 
el tamaño de celda a escoger debe encontrarse. Sin constituir «recetas» infalibles 
a la hora de elegir un tamaño de celda, constituyen herramientas útiles que deben 
considerarse antes de interpolar un conjunto de puntos. 

Para información más detallada puede visitarse la Web [188], donde pueden 
es posible además descargar materiales adicionales. 

13.2.9. Comprobación del ajuste. Validación 

Algunos métodos como el kriging dan una estimación del error además de la 
capa de valores interpolados. En los métodos aproximados tales como el ajuste 
de funciones polinómicas, puede calcularse el residuo cuadrático según 



(13.2.11) 



(13.2.12) 



(13.2.13) 



(13.2.14) 


Es decir, como el cuadrado de la diferencia entre el valor real y el estimado. 
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En los métodos exactos, por propia definición, este valor es cero, lo cual no 
quiere decir, lógicamente, que la capa interpolada sea «perfecta» (lo es, pero solo 
en los puntos de partida), ni que no pueda llevarse a cabo una validación. 

Una forma habitual de proceder es, si se dispone de un juego grande de datos 
(con muchos puntos), «reservar» algunos de ellos para una validación posterior. Se 
interpola así una capa a partir de la mayor parte de ese conjunto, y se comprueba la 
diferencia entre los valores estimados en los puntos restantes y los valores medidos 
en los mismos. Los valores estimados no han sido influenciados por los valores 
reales en dichos puntos, ya que no se han empleado en la interpolación. 

Si no disponemos de un conjunto de datos de validación y el juego de datos 
disponible es reducido y no podemos separar una parte de él para validar el re- 
sultado, podemos llevar a cabo un proceso de validación cruzada. En este proceso, 
se calculan por interpolación puntos en cada una de las coordenadas de los puntos 
de muestreo, empleando en cada caso todos los puntos restantes. 

De esta forma, obtenemos un conjunto de pares de valores con los valores reales 
y estimados en cada punto, que podemos mostrar en una gráfica como la de la 
figura 13.13. De igual modo, podemos efectuar un análisis de regresión y obtener la 
expresión de la recta de ajuste, el coeficiente de correlación de esta o el residuo medio 
cuadrático. El valor representativo en este caso, no obstante, es la propia expresión 
de la función. En caso de un ajuste perfecto, la recta debe ser de la forma y = x, 
por lo que resulta interesante representar esta recta ideal para poder comparar. 



Figura 13.13: Validación cruzada previa de datos puntuales para interpolación. 


13.3. Densidad 

Además de los métodos de interpolación, hay otro tipo de operaciones que 
pueden realizarse sobre capas de puntos, y que dan como resultado capas ráster. 

Supongamos el siguiente caso. Se tiene una capa de puntos como la de la 
figura 13.15 que indica los registros de observación de una determinada especie. 
Si queremos crear un mapa de densidad de individuos, nos encontramos en un 
caso similar al que implica la interpolación: la carencia de datos a lo largo de todo 
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el espacio. En este caso, al igual que entonces, podemos aplicar formulaciones 
específicas para calcular dicha densidad. 

Como se vio en el apartado 12.4, la densidad representa la intensidad (propie- 
dad de primer orden) del patrón de puntos, que es una realización concreta del 
proceso de puntos que lo ha generado. 

Por simplicidad, ignoraremos por el momento los atributos asociados a cada 
punto. Es decir, consideraremos únicamente el dato espacial, que nos dice que en 
las coordenadas del punto ha sido observada una especie. Asociando a cada punto 
un área de influencia (por ejemplo, el radio de movimiento conocido de la especie), 
podemos calcular la capa de densidad de esta sin más que contar en cada celda 
el número de puntos observados cuyo área de influencia incluye a dicha celda, y 
dividiendo después por la superficie del área de influencia. 

La figura 13.14 muestra un ejemplo sencillo con la áreas de influencia de dos 
únicos puntos. Donde ambas áreas intersecan, la densidad es, lógicamente, mayor. 
Las celdas que no están en el área de influencia de ningún punto tienen un valor 
de densidad nulo. 



Figura 13.14: Esquema del cálculo de densidades utilizando un área de influencia fija. 

La elección del área de influencia afecta directamente al resultado obtenido, tal 
como puede verse en la figura 13.15, que muestra dos capas de densidad calculadas 
para distintos radios de influencia. 

Se asume por defecto que el área de influencia es circular (mismo alcance de 
dicha influencia en todas direcciones), y que es la misma para todos los puntos. 

En realidad, puede entenderse la creación de una capa de densidades como un 
histograma bidimensional, siendo por tanto una función de probabilidad. 

La pertenencia o no al área de influencia de cada punto es una función discon- 
tinua. Para crear capas de densidad con transiciones suaves, pueden utilizarse fun- 
ciones distintas de modo que la influencia varíe con la distancia de forma continua. 

En estadística, una función núcleo o núcleo (kernel) es una función de densidad 
bivariante y simétrica, empleada en la estimación de funciones de densidad de 
probabilidad de variables aleatorias. El caso anterior en el que todos puntos de 
la ventana de influencia tienen el mismo peso es un caso particular de núcleo, 
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Figura 13.15: Capas de densidad a partir de una capa de puntos. El tamaño del radio 
de influencia en (b) es el doble que en (a). 


pero existen muchos otros que dan lugar a estimaciones no discontinuas. La 
teoría acerca de este tipo de funciones y su uso no se desarrollará aquí, pudiendo 
consultarse, por ejemplo, en [189]. 

Un núcleo de uso frecuente es el mostrado en la figura 13.16, denominado 
gaussiano, cuya aplicación resulta en capas suavizadas y continuas (Figura 13.17), 
y cuya expresión es 


k(h) 



\/h<r 


donde h es la distancia al punto y r el radio máximo de influencia. 



(13.3.1) 


Figura 13.16: Comparación entre una función núcleo constante (en trazo punteado) y 
un núcleo gaussiano (en trazo continuo) para un radio de influencia r = 2. 

Como puede observarse comparando las figuras 13.15yl3.17, la diferencia entre 
el uso de uno u otro núcleo es notable, pero la utilización de radios distintos, indepen- 
dientemente del método empleado, da lugar a resultados muy diferenciados. El radio 
de influencia máxima es, pues, el parámetro más importante en la estimación de den- 
sidades, y debe seleccionarse de acuerdo con la distribución de los puntos muéstrales. 
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Figura 13.17: Capas de densidad a partir de una capa de puntos mediante núcleo 
gaussiano. El tamaño del radio de influencia en (b) es el doble que en (a). 


Además de emplear las coordenadas de cada punto para la estimación de densi- 
dad, pueden ponderarse estos con los atributos de cada uno de ellos. Así, partiendo 
de una capa de puntos que represente núcleos poblacionales, para cada uno de 
los cuales se disponga de su número de habitantes, puede obtenerse una capa de 
densidad de población. O, en el caso de los puntos que representan observaciones 
de individuos de una especie, recoger en estos puntos no solo el hecho de que se 
ha producido un avistamiento, sino cuántos de ellos. 

La figura 13.18 muestra un ejemplo del cálculo de densidades si se emplea 
ponderación de los puntos. 



Figura 13.18: Esquema del cálculo de densidades utilizando un área de influencia fija 
y ponderación según valores. El punto inferior derecho tiene un peso p= 2, mientras que 
el superior izquierdo un peso p= 1. 

En el caso por ejemplo de las observaciones de una especie, la capa de densidad 
nos da igualmente una medida de la probabilidad de encontrar esa especie en cada 
celda. El cálculo de estas probabilidades es la base para el desarrollo de modelos 
predictivos más complejos. Estos modelos incluyen la utilización de variables de 
apoyo, así como muéstreos no solo de presencia, sino también de ausencia. 



13.4. Resumen 


La información vectorial, en particular la disponible en forma de puntos, puede 
convertirse en capas ráster a través del uso de métodos de interpolación. Estos 
permiten calcular valores en puntos no muestreados, a partir de valores recogidos 
en una serie de puntos. De este modo, se puede asignar un valor a cada celda de 
una capa ráster, y crear una representación continua de la variable recogida en 
los puntos de muestreo. 

Existen muchos métodos de interpolación distintos, entre los que cabe destacar 
los siguientes por su implementación habitual en los SIG: 

■ Vecino más cercano 

■ Ponderación por distancia 

■ Ajuste de polinomios 

■ Curvas adaptativas 

■ Kriging 

La elección del método a emplear debe realizarse en función del tipo de datos 
a interpolar, las características de estos, y los requerimientos y usos previstos 
de la capa resultante, entre otros factores. Asimismo, es importante elegir una 
resolución de celda adecuada y, en caso que los puntos de muestreo no vengan 
dados a priori, diseñar un muestreo óptimo. 

Empleando métodos de validación y validación cruzada, puede comprobarse 
la bondad de ajuste de la capa interpolada y la validez de los datos de partida y 
el modelo empleado. 

Junto con los métodos de interpolación, el calculo de densidades permite 
igualmente la creación de capas ráster a partir de datos puntuales. 



Capítulo 14 


Álgebra de mapas 


En este capitulo veremos en qué consiste el álgebra de mapas, el cual contiene el conjunto 
de procedimientos que nos permiten analizar capas ráster y extraer información a partir de 
ellas. Es importante, por lo tanto, que conozcas bien las particularidades del formato ráster 
y estés familiarizado con los conceptos propios de este modelo de representación espacial. 

Además del álgebra de mapas como tal, veremos algunos ejemplos de análisis para 
mostrar el aspecto práctico de cuanto se detalla a lo largo del capítulo. Estos ejemplos no son 
estudiados aquí en profundidad, ya que serán descritos de forma más extensa en sucesivos 
capítulos. Por ello, no debes preocuparte si no comprendes completamente los procesos 
descritos, sino tan solo la base conceptual del álgebra de mapas sobre la que se sustentan. 


14.1. Introducción 

La información contenida en las capas es susceptible de ser analizada para la 
obtención de otras capas referentes al mismo espacio geográfico, pero que contengan 
distinta información derivada de aquella. El álgebra de mapas es el conjunto de 
procedimientos y métodos que permiten llevar a cabo dicho análisis y extraer 
nuevos valores a partir de los contenidos en una o varias capas. En este capítulo 
revisaremos las bases e ideas fundamentales del álgebra de mapas, que nos ayudaran 
a comprender todos los restantes procesos que se construyen sobre sus conceptos. 

Se entiende por álgebra de mapas 1 el conjunto de técnicas y procedimientos 
que, operando sobre una o varias capas en formato ráster, nos permite obtener 
información derivada, generalmente en forma de nuevas capas de datos. Aunque 
nada impide que este proceso se lleve a cabo sobre capas vectoriales, se entiende 
que el álgebra de mapas hace referencia al análisis desarrollado sobre capas ráster, 
pues estas, por su estructura regular y sus características inherentes, son mucho 
más adecuadas para plantear los algoritmos y formulaciones correspondientes. Los 
procedimientos que se aplican sobre información geográfica en formato vectorial 
son por regla general clasificados dentro de otros bloques de conocimiento, como es 

1 Aunque esta denominación es la original y más extendida, puede dar lugar a malentendidos. 
No debe confundirse aquí la idea de mapa y pensar que hablamos de un documento cartográfico 
en su sentido clásico, sino que hablamos de capas, y en particular de capas ráster. Sería más 
correcto hablar de un álgebra de capas ráster, pero se mantiene por costumbre el uso de álgebra 
de mapas para definir al conjunto de técnicas que veremos a lo largo de este capítulo. 
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por ejemplo el caso de la operaciones geométricas sobre datos vectoriales (incluidos 
dentro de la geometría computacional), cuyos procesos se tratarán en el capítulo 18 . 

Conviene aclarar que, en la práctica y el uso diario de los SIG, el término 
álgebra de mapas es habitualmente usado de forma errónea. Ello es debido a que 
la gran mayoría de las aplicaciones SIG implementan algún tipo de funcionalidad 
para la combinación de un número dado de capas ráster, de forma que pueden 
relacionarse mediante expresiones matemáticas para la obtención de una nueva 
capa, y esta funcionalidad se designa normalmente como álgebra de mapas o en 
ocasiones calculadora de mapas. 

La gran utilidad de esta funcionalidad y su uso habitual hacen que se asocie 
casi exclusivamente con ella el concepto de álgebra de mapas, olvidando — o 
desconociendo — , que también las restantes funcionalidades de análisis emplean el 
álgebra de mapas como base fundamental. Es por ello más correcto utilizar en tal 
caso esa segunda denominación, calculadora de mapas, para dichas herramientas, 
ya que, si bien el uso de estas operaciones entre capas es una aplicación de los 
conceptos propios del álgebra de mapas, no es la única, y no debe pensarse que 
todo él es expresable de ese modo. 

Como tal, el álgebra de mapas lo forman un conjunto de variables (los mapas), 
expresiones y funciones, los cuales, a través de una sintaxis adecuada, permiten la 
obtención de nuevos resultados geográficos. Las funciones que se implementan en 
las calculadoras de mapas son, como veremos, un subconjunto de las posibles, lo 
que bien podríamos denominar una aritmética de mapas. El concepto de álgebra 
de mapas, más extenso que el anterior, constituye sin embargo no una herramienta 
puntual, sino un completo marco de trabajo para el manejo de capas ráster y, muy 
especialmente, su análisis encaminado a la obtención de nuevos resultados. 

Si analizamos las practicas geográficas hasta nuestros días, vemos que el álgebra 
de mapas como proceso de análisis no es algo nuevo. La idea de utilizar mapas 
existentes para generar otros nuevos o simplemente extraer de ellos resultados 
cuantitativos es una práctica común desde el mismo momento en que aparece la 
cartografía moderna. Sin embargo, es con la aparición de los Sistemas de Infor- 
mación Geográfica y la posibilidad de procesar los datos geográficos en un entorno 
informatizado cuando se dota de formalismo a estos planteamientos y se define 
con rigor el conjunto de herramientas de análisis. 

La definición actual del álgebra de mapas la debemos a Dana Tomlin [ 1 ], quien 
estableció la división principal de funciones y dio cuerpo a la disciplina, sentando 
así las bases para lo que es hoy en día la manera habitual de proceder en el aná- 
lisis de capas geográficas ráster. Posteriormente, otros autores han desarrollado 
generalizaciones y extensiones de las ideas de Tomlin, pero son estas las que, desde 
el punto de vista práctico, cubren la mayor parte de casos posibles y resultan de 
utilidad directa para el análisis habitual. 

Más allá de lo que se desarrolla en este capítulo, las ideas que veremos a continua- 
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ción se van a repetir de forma continua en la mayoría de capítulos de esta parte, pues 
constituyen la base formal y conceptual de los análisis que siguen en dichos capítulos. 

Para comenzar el estudio del álgebra de mapas, veamos unos casos prácticos 
que nos servirán para introducir con posterioridad los elementos básicos. En primer 
lugar, consideremos la siguiente expresión, que define la bien conocida Ecuación 
Universal de Pérdidas de Suelo (USLE) [190] 

A=RK-LS-CP (14.1.1) 

donde A representa las pérdidas totales en toneladas por hectárea y año, y los fac- 
tores R,K,LS,C y P representan la influencia de los diversos factores (agresividad 
del clima, tipo de suelo, topografía, uso de suelo, y prácticas de conservación) sobre 
dichas pérdidas. La USLE representa, por tanto, un modelo sencillo que combina 
cinco variables, todas ellas susceptibles de ser recogidas en las correspondientes 
capas ráster. Si extendemos el cálculo puntual de la variable A a todos los puntos 
de la zona estudiada, obtendremos una nueva capa de dicha variable, evaluando la 
anterior expresión para cada una de las celdas de esas capas ráster (Figura 14.1). 



Figura 14.1: Puede extenderse una formula algebraica tal como la de la Ecuación 
Universal de Pérdidas de Suelo (USLE) a un conjunto de capas. Basta operar celda a 
celda con las capas que contienen las variables implicadas, para obtener una nueva capa 
resultante con el conjunto de valores calculados. 

La discretización del espacio que implica la representación en formato ráster 
de un parámetro sobre una superficie dada, hace que ese análisis de «todos los 
puntos» se materialice en un análisis de todas las celdas que contiene la nueva capa 
a obtener. Esto nos hace ver la idoneidad de este formato para trasladar las ideas 
matemáticas de modelos sencillos como la USLE a un álgebra de mapas donde 
estos modelos no sean aplicados a un emplazamiento concreto, sino a toda una 
región de interés a tratar. 

En este caso, basta con aplicar la expresión mostrada en la figura 14.1 celda a 
celda, y obtener tantos valores resultantes como celdas haya, que conformarán una 
nueva capa con la distribución espacial de las pérdidas de suelo correspondientes. 
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Consideremos ahora que, junto con el mapa de pérdidas de suelo obtenido 
según lo anterior, disponemos de una división en subcuencas de la zona de estudio. 
Puede resultar interesante asociar a cada una de las unidades hidrológicas un valor 
relacionado con los valores de pérdidas de suelo que se dan en ella. Por ejemplo, 
la media de los valores de pérdidas de suelo de todas las celdas de la subcuenca. 
Partiendo de estos dos mapas, podemos obtener un tercero que nos indique las 
pérdidas medias en cada cuenca, de interés sin duda para localizar las unidades 
que puedan presentar mayores problemas de erosión (Figura 14.2). 



Figura 14.2: Valores de pérdidas de suelo por subcuencas. 


La base conceptual en este caso vemos que es distinta al primer supuesto, ya que 
no extendemos ningún modelo puntual aplicándolo en todas las celdas con distintos 
valores de entrada para cada una de ellas, sino que estas van a contener un valor 
medio asociado al total de celdas incluidas en su misma subcuenca. Esta forma de 
proceder ya no se corresponde con el caso anterior y no puede ser llevada a cabo 
con las funcionalidades de calculadora de mapas que citábamos como habituales 
en los SIG, ya que no se da un análisis entre capas celda a celda, sino un análisis 
dentro de la propia capa con otras celdas relacionadas a través de esa pertenencia 
a la misma unidad hidrológica. No obstante, como veremos, este tipo de funciones 
también forman parte del álgebra de mapas. 

Por último, supongamos que es de interés estudiar la distribución de valores de 
esas pérdidas de suelo. Un histograma de frecuencias resultaría de gran utilidad. 
En este caso, el análisis trabaja una vez más sobre la capa de pérdidas de suelo, 
pero no genera nuevos resultados geográficos. Aun así, la generación de nuevas 
capas no es una condición básica del álgebra de mapas, ya que sus procesos pueden 
tener como resultado elementos muy diversos. 

Todos estos ejemplos son parte de los resultados que pueden obtenerse utilizando 
los distintos componentes del álgebra de mapas, que a continuación detallaremos. 
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14.2. Tipos de funciones en el álgebra de mapas 

Las funciones son el elemento principal del álgebra de mapas. Cuatro son los 
tipos principales de funciones que podemos definir, agrupadas según la forma en 
que toman la información necesaria para su cálculo de entre la contenida en todas 
las celdas de las capas de origen. 

■ Local. El valor en cada celda de la capa resultante es función únicamente 
de los valores en esa misma celda en las capas de partida. 

■ Focal. El valor en cada celda de la capa resultante es función del valor en 
dicha celda y en las situadas en un entorno definido alrededor de la misma. 

■ Zonal o regional. El valor en cada celda de la capa resultante es función 
del valor de todas las celdas conectadas a esta que presentan un mismo valor 
para una de las capas de entrada (pertenecen a la misma clase que esta) . 

■ Global. El valor resultante de la función es obtenido a partir de todas las 
celdas de la capa. 

La combinación de distintas funciones y de enfoques variados da lugar a un 
enorme conjunto de operaciones de análisis basados en el álgebra de mapas así defi- 
nido. Este conjunto es el que dota de toda su potencia a los SIG como herramientas 
de análisis del medio, y permite extraer de los datos geográficos en formato ráster 
toda la información que realmente contienen. 

14.2.1. Funciones locales 

Las funciones locales asignan valores a una celda en base a los valores que esa 
misma celda presenta para cada una de las capas de entrada, operando con estos de 
una forma u otra. Es decir, el valor resultante para una localización dada es función 
exclusivamente de lo que se encuentra en dicha localización, no dependiendo en 
modo alguno de otras localizaciones (otras celdas) (Figura 14.3). 

Resultado 


Entrada 



Figura 14.3: Las funciones de análisis local analizan los valores de una celda concreta en 
una serie de capas para obtener el valor resultante. En rojo, celdas de partida analizadas. 
En verde, celda que recoge el resultado. 
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Las funciones locales son las que utilizamos cuando empleamos esa anterior- 
mente citada aritmética de mapas, tal y como veíamos por ejemplo en el caso 
de la USLE. Aunque otro tipo de funciones también operan con varias capas, la 
combinación de una serie de ellas suele llevarse a cabo con funciones locales, que 
calculan los valores para cada punto de acuerdo con los valores de dichas capas en 
ese punto. El ejemplo de la USLE es una función sumamente sencilla, que tan solo 
multiplica las capas de partida, pero pueden elaborarse funciones más complejas 
utilizando todos los operadores disponibles, que estudiaremos más adelante. 

Una función de tipo local puede ser también aplicada sin necesidad de tener 
una serie de capas, sino con una única capa de partida. Por ejemplo, un cambio 
de unidades es una función local, ya que cada uno de los valores expresados en las 
unidades de destino solo depende del valor expresado en las unidades de origen 
en cada propia celda. Si una capa conteniendo elevaciones expresadas en metros 
la multiplicamos por 100, obtenemos una nueva capa con valores de elevación en 
centímetros, habiendo aplicado una función local para realizar la conversión. 

De igual modo, convertir los valores de una capa de pendientes de radianes 
a grados requiere multiplicar sus valores por 180/7T. 

Además de operar con escalares, podemos aplicar también funciones matemáti- 
cas. Por ejemplo, las capas que presentan un gran coeficiente de variación (elevada 
varianza en relación a la media de los valores de la capa) muestran mucha más infor- 
mación si aplicamos una transformación logarítmica. En la figura 14.4 vemos una ca- 
pa de área acumulada a (este concepto hidrológico se explicará en el apartado 15.6.3) 
junto a otra que representa el parámetro log(a) , apreciándose claramente la diferen- 
cia entre ambas en cuanto a la riqueza de información visual que aportan. Esta trans- 
formación logarítmica es, claramente, una función local dentro del álgebra de mapas. 

Si en lugar de convertir la anteriormente citada capa de pendientes de radianes 
a grados como mencionábamos, queremos convertirla en porcentaje, en este caso 
no es una operación con un escalar lo que debemos llevar a cabo, sino aplicar la 
función matemática tan{x), también como una función local de álgebra de mapas. 

Una aplicación común de una función local con una sola capa la encontramos 
en la normalización de valores. En ocasiones, antes de efectuar un proceso que 
englobe a varias capas (por ejemplo, otra función de análisis local pero multicapa), 
es necesario homogeneizar estas de modo que todas se hallen en un mismo rango de 
valores. Este proceso se denomina normalización. Es habitual que el rango común 
sea el intervalo (0,1), para lo cual se aplica a cada capa la función local definida 
por la siguiente expresión: 


Vij 


%ij %min 
%max % min 


(14.2.1) 


donde yij es el valor normalizado en la celda ij , x el valor de esa celda en la capa 
inicial y x mm y x max , respectivamente, los valores mínimo y máximo de la variable 
en el conjunto de celdas de la capa. 
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Figura 14.4: La aplicación de una transformación logarítmica modifica la representación 
visual de una capa, a) Capa original, b) capa tras trasformación logarítmica. 


Si en vez de aplicar una función matemática sobre el valor de cada celda, 
aplicamos una serie de criterios referidos a dicho valor mediante operadores de 
comparación, podemos llevar a cabo un proceso de clasificación. De este modo, 
podemos obtener a partir de una capa continua una capa discreta en la que las 
celdas serán clasificadas en grupos según el valor de la variable de partida, o bien 
reconvertir una clasificación ya existente en otra de acuerdo a unas condiciones 
establecidas. La figura 14.5 muestra una clasificación de los valores de pendiente 
en clases, práctica habitual en muchas disciplinas a la hora de trabajar con este 
parámetro. Para ello se ha utilizado el siguiente criterio. 

Í 1 si s < 5 
2 si 5<s< 10 
3 si 10<s<20 
4 si s > 20 

donde s' es la clase de pendiente, y s el valor de la pendiente en porcentaje. 


(14.2.2) 




Figura 14.5: Mediante una función local de reclasificación, podemos convertir una capa 
de valores continuos en una capa de clases con información discreta. 
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Otra forma de convertir una capa continua en una categórica es dividir en 
clases no según un criterio relativo a los valores, sino a la extensión de las clases. 
La figura 14.6 muestra el mismo mapa de pendientes del ejemplo anterior pero 
reclasificado en cinco clases de igual área, de tal modo que la superficie cubierta 
por cada una de ellas en la capa resultante es la misma. 



Figura 14.6: Clasificación de una capa en clases de igual área. 


También es posible reclasificar capas que ya contienen información categórica, 
sustituyendo los valores de una clase por un nuevo valor. Puede utilizarse para 
crear clasificaciones menos detalladas, agrupando clases similares en una única. 

Dentro de las funciones locales sobre una única capa, podemos considerar 
como un caso particular la generación de nuevas capas «desde cero», es decir, sin 
basarnos en los valores de ninguna capa previa. Por ejemplo, crear una capa de 
valor constante k o una capa con valores aleatorios dentro de un intervalo definido. 
En este supuesto, se toma de la capa origen solo su extensión y tamaño de celda, 
pero los valores son generados sin basarse en los existentes en ella. 

Cuando las funciones locales se aplican a varias capas, la forma de combinar 
estas es muy variable. Junto a las operaciones que ya hemos visto, podemos utilizar 
algunas otras, y de modos igualmente variados. El conjunto de ellas lo dividimos 
en los siguientes grupos: 

■ Operadores aritméticos. Para formar expresiones con las distintas capas 
tales como la ecuación USLE que ya conocemos. 

■ Operadores lógicos. Pueden tomarse los valores de las capas como valores 
booleanos (1 o 0, verdadero o falso), o aplicar expresiones lógicas de tipo 
pertenece al conjunto u operadores de comparación, entre otros. 

■ Parámetros estadísticos. Por ejemplo, el valor mayor de entre las todas las 
capas. También pueden recogerse otros como el orden del valor de una capa 
dentro de la serie ordenada de valores en todas las capas, el código de la capa 
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donde aparece ese valor mayor, o el numero de capas con valores iguales a uno 
dado. La figura 14.7 muestra algunos ejemplos simples basados en estas ideas. 
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Figura 14.7: Algunos ejemplos sencillos de análisis local estadístico con múltiples capas. 
En la fila superior, capas de origen y su numeración correspondiente. En la inferior, de 
izquierda a derecha: valor máximo, valor más frecuente (mayoría), y capa de máximo 
valor. ND indica celdas sin datos en las cuales no puede establecerse un valor resultante 
por no estar este bien definido. 

Comenzando por el supuesto más sencillo de utilizar únicamente dos capas, 
podemos aplicar operadores lógicos tales como <,>,^,=,< ° >• Por ejemplo, 
con dos capas con información categórica de usos de suelo correspondientes a dos 
fechas distintas, el operador de desigualdad nos servirá para detectar en la nueva 
capa resultante aquellas celdas donde el uso de suelo haya cambiado. 

Cuando tenemos un conjunto mayor de capas, podemos aplicar los operadores 
anteriores, e incluso combinar operadores de varios grupos distintos de entre 
los anteriores. Por ejemplo, la técnica conocida como Ordered Weighted Average 
(OWA) [191], aplica una media ponderada de las capas de la forma 

n 

y=^2 z iki ; kiEN (14.2.3) 

2—1 

siendo n el número de capas y el valor i-esimo de los de las distintas capas, 
ordenados estos en orden ascendente. El valor i\ sería el más pequeño de todas 
las capas en la celda problema, y i n el mayor. Esto hace que el valor que es 
multiplicado por ki no esté siempre asociado a una capa fija (i no representa a una 
capa) , sino a una posición dentro de la lista ordenada formada por los valores de 
todas las capas para cada celda. 

La aplicación del OWA puede verse como un uso combinado de una función 
de análisis local de tipo estadístico que se encarga de generar nuevas capas con 
los valores i-esimos, y la posterior aplicación de una operación aritmética. Esta 
última ya se aplicaría de la forma habitual, pero sobre las capas provenientes de 
la primera operación, no sobre las originales. 
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Aunque si trabajamos con capas de tipo categórico carece de sentido desde un 
punto de vista conceptual el operar aritméticamente con valores que identifican una 
clase, las operaciones aritméticas nos pueden servir de igual modo en este caso para 
obtener nuevas capas. Una función local aritmética nos sirve como herramienta 
para realizar algunas tareas, entre ellas una habitual como es combinar en una 
sola capa dos clasificaciones distintas. 

Partiendo de una capa de usos de suelo y una de tipos de suelo, podemos 
obtener una nueva clasificación que combine ambas (Figura 14.8). Un proceso 
similar se realiza, por ejemplo, para el cálculo del Número de Curva [192], una 
variable hidrológica que permite calcular la generación de escorrentía a partir de 
una precipitación dada. La clase de Número de Curva se asigna, como en este 
ejemplo, en función del uso y el tipo de suelo. El proceso es, en realidad, una 
intersección de las zonas definidas por cada capa. 



Figura 14.8: Combinación de dos capas categóricas para crear una nueva clasificación 
que une ambas. 

Para efectuar esta intersección, debemos en primer lugar reclasificar las capas 
de inicio de tal modo que un valor en la capa resultante defina unívocamente una 
única combinación de estas. Después, operaremos con las capas reclasificadas, 
eligiendo un operador que nos permita mantener esa correspondencia biunívoca 
entre pares de valores de origen y valor resultante. 

Una forma de hacer esto, suponiendo un número de clases m en la primera 
clase y n en la segunda, es reclasificar la primera de ellas mediante la expresión 

¿i = k l ; A: EN,i = l...m (14.2.4) 

donde c( es el nuevo valor a asignar a la clase i-ésima. Es decir, se asignan potencias 
sucesivas de un valor natural. De igual modo, se asignan los nuevos valores a la 
segunda capa siguiendo la progresión de potencias, de la forma 

c' i = k i+m ; jfeeN,* = l...n (14.2.5) 

Con las capas anteriores, basta sumarlas para obtener una nueva en la que el 
valor de cada celda nos define inequívocamente a partir de qué valores originales 
se ha calculado. 
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Figura 14.9: Ejemplo de combinación de dos capas categóricas, a) capas originales, b) 
capas reclasificadas, c) resultado. 


Tipo 

Valor original 

Valor reclasificado 

Suelo A 

1 

1 

Suelo B 

2 

2 

Suelo C 

3 

4 

Uso suelo A 

1 

8 

Uso suelo B 

2 

16 

Uso suelo C 

3 

32 


Cuadro 14.1: Esquema de reclasificación para combinar dos capas categóricas. 


Para ver un ejemplo que sea manejable, en la figura 14.9 se muestran dos capas 
con su valores originales, las capas reclasificadas según el esquema anterior, y la 
capa resultante. Para interpretar esta última, la tabla 14.1 muestra el esquema de 
reclasificación y la tabla 14.2 explica el significado de los valores de la capa obtenida. 

Los SIG más comunes incorporan entre sus elementos funciones que simplifican 
este proceso y hacen innecesario operar de este modo, por lo que no es probable 
que apliques estos razonamientos manualmente. No obstante, resulta de interés el 
mostrar estas técnicas para estimular y desarrollar la capacidad de razonar espacial 
y numéricamente en base a los conceptos del álgebra de mapas, conociendo estos 
con detalle. 

Como ya se dijo en el capítulo introductorio de esta parte, la combinación y 
superposición de capas es una de las tareas más comunes dentro de un SIG. Por 
ello, veremos en próximos capítulos cómo también puede llevarse a cabo con capas 
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Valor resultante 

Tipo suelo 

Tipo uso suelo 

9 

Suelo A (1) 

Uso suelo A (8) 

10 

Suelo B (2) 

Uso suelo A (8) 

12 

Suelo C (4) 

Uso suelo A (8) 

17 

Suelo A (1) 

Uso suelo B (16) 

18 

Suelo B (2) 

Uso suelo B (16) 

19 

Suelo C (4) 

Uso suelo B (16) 

33 

Suelo A (1) 

Uso suelo C (32) 

34 

Suelo B (2) 

Uso suelo C (32) 

36 

Suelo C (4) 

Uso suelo C (32) 


Cuadro 14.2: Explicación de valores resultantes de la combinación de dos capas categóricas. 


vectoriales, mediante algoritmos completamente diferentes pero con un concepto 
global idéntico a lo que acabamos de ver. 

Por ultimo, para concluir esta sección es interesante señalar que la gestión de 
valores sin datos es un aspecto importante en el empleo de operadores aritméticos 
en funciones locales. En general, se adopta como práctica habitual el que una 
operación aritmética entre celdas de varias capas devuelva un valor de sin datos 
siempre que alguna de las celdas implicadas carezca de datos (es decir, tenga un 
valor de sin datos). Dicho de otro modo, la presencia de un valor de sin datos en 
la operación hace que la celda resultante reciba automáticamente también valor 
de sin datos, particularmente el establecido para la capa resultante. 

Esta forma de proceder, además de dar un resultado coherente con los datos de 
entrada, puede utilizarse como herramienta para, aplicando inteligentemente capas 
con zonas sin datos, preparar las capas de entrada de cara a su uso en otros análisis. 
Ese es el caso de la creación de máscaras, que nos permiten restringir la información 
de la capa a una parte concreta de la misma. La figura 14. 10 muestra cómo un modelo 
digital del terreno es recortado para contener información únicamente dentro de una 
zona definida, en este caso todas las celdas situadas a más de 180 metros de elevación. 

Para realizar el recorte, la capa que define la zona de interés contiene valor 1 
en las celdas interiores y el valor de sin datos correspondiente en las exteriores. Al 
multiplicarlo por el modelo digital del terreno, el resultado es la propia elevación 
en las interiores, y el valor de sin datos en las exteriores, ya que una de las capas 
no tiene datos suficientes para poder generar otro resultado. 

También veremos más adelante que ese uso de mascaras tiene su equivalente 
vectorial, existiendo una operación de recorte para capas de datos vectoriales. 
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Figura 14.10: Recorte de una capa empleando una mascara con celdas sin datos. La rampa 
de colores se ha variado en la capa recortada para ajustarse al nuevo rango de valores de esta. 


14.2.2. Funciones focales 


Las funciones de análisis focal operan sobre una sola capa de datos, asignando 
a cada celda un valor que deriva de su valor en la capa de partida, así como de los 
valores de las situadas en un entorno inmediato de esta (Figura 14.11). La función 
focal queda así definida por las dimensiones y forma del entorno a considerar, así 
como por la función a aplicar sobre los valores recogidos en este. 



Resultado 


Entrada 


Figura 14.11: Las funciones de análisis focal analizan los valores de una celda y las 
situadas en un entorno de esta para obtener el valor resultante. En rojo, celdas de partida 
analizadas. En verde, celda que recoge el resultado. 

A diferencia de las funciones locales, las focales no se aplican sobre varias capas, 
ya que la información necesaria se extrae de la vecindad de cada celda, dentro de 
la propia capa de partida. 

Las funciones focales más habituales emplean un entorno cuadrado 3x3 centra- 
do en la celda, que se va desplazando por la capa de tal modo que todas las celdas van 
siendo designadas como celdas centrales, y un nuevo valor es calculado para ellas. 
Este entorno de celdas a considerar se denomina frecuentemente ventana de análisis 
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Para definir las operaciones sobre esta ventana, es frecuente introducir una 
notación como la siguiente con el fin de simplificar las expresiones. 


Z 1 

Z 2 

z 3 

z 4 

z 5 

z 6 

z 7 

Z 8 

Z 9 


Figura 14.12: Notación para una ventana de análisis en funciones focales. 

siendo Z 5 la celda central, la cual recibirá el valor resultante de la operación efec- 
tuada. Puesto que los análisis focales basados en esta ventana tipo son habituales, 
haremos uso de esta notación en diversos puntos dentro de esta parte del libro. 

Aunque menos frecuentes, pueden utilizarse ventanas de tamaño mayor, nxn, 
siendo n un valor impar para que de este modo exista un celda central. De otro mo- 
do, la ventana no podría quedar centrada sobre la celda a evaluar, sino desplazada. 
De igual forma, la ventana no ha de ser necesariamente cuadrada, y otras formas 
distintas son aplicables. La figura 14.13 muestra algunas de las más comunes, todas 
ellas también aplicables a distintos tamaños. 



Figura 14.13: Algunos de los tipos de ventana de análisis más comunes en distintos 
tamaños, a) cuadrada, b) circular 

Con los valores de las celdas contenidas en la ventana de análisis pueden 
realizarse operaciones muy diversas, entre las que cabe citar las siguientes: 

■ Cálculo de descriptores estadísticos. Los más habituales son la media, 
la mediana, los valores extremos o el rango de valores. Para el caso de valores 
discretos, son comunes parámetros como el número de clases (número de 
celdas con distinto valor) dentro de la ventana de análisis. 

■ Combinaciones lineales. De acuerdo con expresiones de la siguiente forma: 
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EÁi ziki 

E?=i h 


; fcjGM 


(14.2.6) 


Este grupo particular de operaciones se conocen como convoluciones, y son 
la base para una larga serie de procedimientos muy comunes en el trata- 
miento de imágenes digitales. Es habitual expresar el conjunto de valores 
ki también en forma de ventana, siendo esta, lógicamente, coincidente en 


sus dimensiones con la de análisis. 


’or ejemplo, como en el siguiente caso: 


1/9 

1/9 

1/9 

1/9 

1/9 

1/9 

1/9 

1/9 

1/9 


Este conjunto de valores de así expresados se conoce comúnmente como 
núcleo o kemel de la convolución. Nótese que el núcleo anterior se corresponde 
con el cálculo de la media aritmética, pudiendo expresarse este descriptor 
estadístico como una combinación lineal de los valores de la ventana, a través 
de un núcleo. 

■ Operaciones matemáticas de forma general. No necesariamente com- 
binaciones lineales, aplican operadores más complejos a los valores de la 
ventana. 

■ Clasificaciones. En función de la configuración de los valores dentro de la 
ventana clasifican la celda en una serie de posibles grupos, de acuerdo con unas 
reglas definidas. El resultado es una capa de información discreta, frente a las 
anteriores que producen capas continuas. Un ejemplo de esto lo encontramos 
la clasificación de formas de terreno, la cual veremos en el apartado 15.8, o 
en la asignación de direcciones de flujo según el modelo D8 (15.6.1). 

Algunas de las funciones anteriores se han de definir de forma específica para 
un tamaño y forma de ventana dado, mientras que otras, como el caso de los 
descriptores estadísticos, pueden definirse de forma genérica. La diferencia estriba 
en que en estos la posición del valor dentro de la ventana de análisis no es relevante, 
mientras que para otras funciones sí lo es. 

El resultado de un operador de análisis focal no ha de ser necesariamente un 
valor que se sitúa en la celda central de la capa resultante una vez ha sido calculado. 
Por ejemplo, y relacionado con lo comentado en el párrafo anterior, [193] propone 
un operador que, evaluando los valores dentro de la ventana de análisis, modifique 
la capa de salida no en la celda central, sino en aquella.que cumpla una condición 
dada. Por ejemplo, aquella que contenga el valor máximo de entre todas las de 
la ventana. Lo importante en este caso no es el valor, sino sobre qué celda se sitúa. 

Con respecto al tamaño de la ventana de análisis, debe mencionarse que la 
utilización de uno u otro tiene dos consecuencias directas: por un lado el proceso 
es más costoso en términos de tiempo a medida que aumentamos la ventana, ya 
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que el número de celdas a analizar es mayor. Por otro, el resultado puede diferir 
notablemente, y es necesario tener en cuenta el significado del parámetro a calcular 
para establecer unas dimensiones correctas — dimensiones en unidades reales, no 
en número de celdas — de la ventana. La figura 14.14 muestra cómo el efecto de un 
filtro de media, el cual produce un desenfoque de la imagen, se hace más patente 
a medida que empleamos ventanas de análisis mayores. 

En [194] puede encontrarse información adicional sobre la noción de escala de 
análisis — especialmente para el caso de análisis del terreno — y otros conceptos 
íntimamente relacionados con la elección de un tamaño de ventana. En el apartado 
15.8 veremos un análisis particular en el que la elección del tamaño de ventana 
es particularmente importante. 



a) b) c) 


Figura 14.14: Resultados de un filtro de mediana sobre una imagen para distintos 
tamaños de ventana, a) 5x5, b) 10 x 10 c) 20 x 20 

Con independencia de dicho tamaño de ventana, siempre vamos a tener algunas 
celdas para las que esta no va a poder ser definida en su totalidad. Estas celdas son 
las situadas en los bordes de la capa, ya que en su caso siempre habrá algunas celdas 
de la ventana que caigan fuera y para los cuales no tengamos un valor definido 
(Figura 14.15). En este caso, debe o bien definirse una nueva formulación para 
estas celdas de borde, o trabajar únicamente con las celdas interiores a la capa, o 
directamente asignar un valor de sin datos a la capa resultante, indicando que no 
puede evaluarse el parámetro en ausencia de algún dato. El optar por una u otra 
alternativa sera función, como ya vimos antes, de si el valor resultante depende 
o no de la posición de los valores de partida. 

Para el caso de una media aritmética, si de los nueve valores de la ventana 
habitual solo tenemos, por ejemplo, seis, podemos operar con ellos y asumir que el 
resultado será satisfactorio. En el caso de asignar direcciones de flujo, sin embargo, 
los valores pueden ser erróneos, ya que tal vez el flujo se desplace hacia las celdas 
fuera de la capa, pero al faltar la información de estas, no sera posible hacer tal 
asignación. Una práctica recomendable en cualquier caso es no limitar la extensión 
de la capa a la mínima que englobe el área del territorio que queramos estudiar, 
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Figura 14.15: En las celdas de borde la ventana de análisis no puede definirse en su 
totalidad. Las celdas en rojo representan celdas fuera de la capa para las cuales no existe 
información 


sino tomar una porción adicional alrededor para que estos efectos de borde no 
tengan influencia sobre nuestro estudio. 


14.2.3. Funciones zonales o regionales 

Las funciones de análisis zonal asocian a cada celda valores relativos no a dicha 
celda ni a un entorno fijo de esta, sino a la clase a la que dicha celda pertenece (Figu- 
ra 14. 16) . Se necesita, por tanto, una capa de apoyo que contenga la pertenencia de 
cada celda a una u otra clase, ya que la utilización de una celda en el análisis no se es- 
tablece por posición, como en los casos anteriores, sino por valor. Esta capa es de tipo 
discreto y representa una teselación del territorio en un número definido de clases. 



Resultado 


Entrada 


Figura 14.16: Las funciones de análisis zonal analizan los valores de todas las celdas 
asociadas a una misma clase cada para obtener el valor resultante. En rojo, celdas de 
partida analizadas. En verde, celda que recoge el resultado. 

Lo habitual es emplear esta capa de clases en conjunción con otra, ya sea de 
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valores continuos o discretos, y extraer de esta segunda los valores a utilizar para 
definir el valor representativo de cada clase. Ese es el caso del ejemplo propuesto al 
principio del capítulo, donde se utiliza el mapa de pérdidas de suelo para asignar 
los valores correspondientes a cada subcuenca. En este caso, como resulta evidente, 
las clases vienen definidas por las subcuencas. 

La definición del conjunto de celdas relacionadas con una dada puede realizarse 
de dos formas distintas (Figura 14.17): 

■ Todas las celdas con el mismo valor que la celda problema, conectadas por 
contigüidad con esta. 

■ Todas las celdas con el mismo valor que la celda problema presentes en la 
capa, con independencia de su conexión. 




Figura 14.17: Formas de definir las clases para el análisis zonal. En verde, celda de 
análisis. En rojo, celdas a considerar en su misma clase para ser empleadas en el cálculo, 
a) asignación por valor con contigüidad, b) asignación únicamente por valor. 


En el caso de las pérdidas por subcuencas, calculábamos con los valores del 
conjunto de celdas pertenecientes a cada clase su media aritmética, pero pueden 
aplicarse igualmente diversos descriptores estadísticos o funciones más complejas, 
al igual que ya vimos en los otros tipos de funciones. 

Los valores a asignar a cada clase pueden extraerse también de la propia capa 
de clases, no siendo necesaria otra capa. En este caso, estos valores resultantes 
suelen tener relación no con un parámetro adicional, sino con la geometría de cada 
clase. Por ejemplo, la superficie o el perímetro de cada tesela pueden recogerse 
como valores asociados a esta. 

Este es un tipo análisis muy frecuente en el estudio del paisaje, y el número de 
parámetros que pueden obtenerse por análisis zonal a partir de una única capa de 
clases es muy elevado. Junto a parámetros sencillos como la citada superficie o el 
perímetro, otros parámetros más complejos pueden servir para recoger la configura- 
ción estructural de las teselas, su riqueza y variabilidad, la fragmentación, etc [195] . 
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14.2.4. Funciones globales 

Las funciones globales son aquellas que utilizan la totalidad de valores de la 
capa para la obtención del resultado. Por su forma de operar, no generan exclu- 
sivamente nuevas capas como las anteriores funciones, sino tanto valores concretos 
como objetos geográficos de diversa índole. 



Figura 14.18: Las funciones de análisis global analizan el conjunto de valores de una 
capa para obtener un valor resultante, que puede ser tanto un objeto geográfico (capa 
ráster o vectorial) como un valor escalar sencillo, una tabla u otro tipo de resultado. 


Por ejemplo, los valores máximo y mínimo de la capa que son necesarios para 
normalizar esta se obtienen mediante una función global. Asimismo, el cálculo de 
un perfil entre dos puntos o el trazado de una ruta óptima sobre una superficie 
de coste acumulado (que veremos en el apartado 19.4) son ejemplos de funciones 
globales que generan un resultado distinto de un mero valor numérico. 




Figura 14.19: Dada una ruta y una capa, podemos obtener un perfil de valores a lo largo 
de la ruta mediante una función global. 

En el apartado dedicado a las funciones locales veíamos cómo la aplicación del 
operador distinto de entre dos capas de uso de suelo correspondientes a distintas 
fechas nos servía para localizar las zonas que habían experimentado cambios en su 
uso de suelo. Tras esta operación, la capa resultante contendrá un valor verdadero, 
habitualmente representado con un 1, en las zonas donde se da esa variación, y 
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falso, codificado con 0, en las restantes. Si queremos cuantificar esa variación, 
podemos aplicar un operador global que sencillamente sume los valores de todas 
las celdas de la capa, lo cual dará como resultado el número total de celdas cuyo 
uso de suelo ha variado en el periodo de tiempo comprendido entre las dos fechas 
representadas por las capas de entrada. 

Puesto que los operadores globales operan sobre la totalidad de la capa, a veces 
resulta conveniente o incluso necesario «eliminar» de esta los valores que no son 
de interés para el cálculo. No debemos olvidar que una capa ráster tiene una forma 
rectangular, la cual raramente se va a corresponder con la de la región de análisis, 
ya sea esta definida por un limite natural o no. El uso de máscaras que vimos en 
14.2.1 es muy práctico a estos efectos. 

Considérese, por ejemplo, que una curva hipsográfica que representa la distri- 
bución de alturas dentro de un área dada (habitualmente una unidad hidrológica), 
no tiene mucho sentido si se aplica a una región delimitada de forma «artificial» 
por los límites rectangulares de la capa. Resulta más lógico aplicar una máscara 
sobre la capa a analizar, de modo que la función global ignore las celdas que, aun 
estando en la capa, no están en la unidad de interés. Estas celdas tendrán asociado 
un valor de sin datos tras la aplicación de dicha máscara. 


14.3. Las variables del álgebra de mapas y su prepa- 
ración 

Las variables que manejamos en el álgebra de mapas son, como hemos visto 
en los ejemplos precedentes, capas en formato ráster y valores escalares que po- 
demos combinar con los anteriores. Para algunas de las funciones resulta necesaria 
únicamente una capa, mientras que para otras son necesarias varias. 

En los ejemplos que hemos visto de combinación de varias capas, hemos dado 
siempre por supuesto que todas ellas tienen una estructura común. Es decir, que 
cubren una misma porción de terreno y lo hacen mediante una malla de celdas 
de las mismas dimensiones, con un mismo tamaño de celda y una misma georre- 
ferenciación. De este modo, un punto del terreno con coordenadas dadas queda 
reflejado en todas las capas en la misma celda i,j, y podemos operar con sus valores 
directamente para obtener un resultado correspondiente a dicho emplazamiento. 

No obstante, a la hora de combinar capas es muy frecuente que estas tengan pro- 
cedencias distintas y esta circunstancia no se dé. En tal caso, hay que preparar las 
capas para adecuarlas a un mismo marco geográfico sobre el que aplicar las funciones 
del álgebra de mapas de forma adecuada. Si este marco consiste en una malla de cel- 
das de dimensiones nxm, y las coordenadas de cada celda i,j son respectivamente 
x ij e yij , deben calcularse los valores de las capas en esas coordenadas a partir de los 
valores en los marcos de referencia originales. Este proceso se denomina remuestreo. 

El remuestreo en realidad es una interpolación similar a la que veíamos en el 
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capítulo 13, con la diferencia de que en este caso los puntos con datos no están 
distribuidos irregularmente sino de forma regular en una malla, con lo que podemos 
dar una expresión para la función interpolante en función de las celdas de origen 
situadas entorno a la coordenada en la que queremos calcular el nuevo valor (la 
del centro de cada celda en la capa remuestreada) . 

Los métodos más habituales de remuestreo son los siguientes: 

■ Por vecindad. Como ya vimos, no se trata en realidad de una interpolación 
como tal, pues simplemente crea la nueva malla situando nuevas celdas cuyos 
valores se calculan por mera vecindad, tomando el de la celda más cercana. 

■ Bilineal. Para una celda en la nueva malla interpolada, su valor en 

función de los de las 4 celdas más cercanas a la misma en la malla original 
viene dado por la expresión. 


= Z(i¿)R(-a)R(b)+Z( itj+ i)R(a)R(-(l-b)) + 

+ z (i+i,j)R(i— a )R{b)+ 

+Z(i +1>j+1 )R(l-a)R(-(l-b)) (14.3.1) 


donde R(x) es una función triangular de la forma 


R(x) = 


x+1 si — l<x<0 
1 — x si — 0<x<l 


(14.3.2) 


■ Interpolación bicúbica. La interpolación bicúbica es un método de inter- 
polación multivariante bidimensional que emplea un polinomio de tercer 
grado para cada una de las direcciones. Son necesarias 16 celdas en lugar de 
las 4 de la bilineal, lo que hace que el método sea más exigente en términos 
de proceso. Para el caso habitual de emplear como función interpolante un 
spline cúbico, se tiene 


siendo 



2 2 

)= z (i+m,j+n)R{m- a)R{-(m-b)) 

(14.3.3) 


m=—ln=—l 


R{x) 

= i((x+2)i-4(x+ 1 ) 3 + +6W 3 + -4(x-l) 3 + ) 

(14.3.4) 


z ( x m six>0 

X + ~( 0 s¡x<0 

(14.3.5) 


Los métodos de remuestreo son un área muy desarrollada en el tratamiento 
de imágenes digitales, aunque, en la práctica, la mayoría de algoritmos existentes 
no presentan una diferencia notable con los anteriores (excepto con el remuestreo 
por vecindad) a la hora de aplicarlos sobre capas ráster de variables continuas en 
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lugar de imágenes. Es por ello que su implementación y uso no es habitual en el 
caso de los SIG. En [196] puede encontrarse una buena introducción a otro tipo 
de funciones utilizadas para el remuestreo de imágenes. 

A la hora de elegir uno u otro de los métodos anteriores, debe tenerse en 
cuenta, fundamentalmente, el tipo de información que contenga la capa. Una 
diferencia fundamental que debe tenerse siempre presente es que, de entre los 
métodos anteriores, el de vecino más cercano es el único que garantiza que los 
valores resultante existen como tales en la capa origen. Ello hace que este sea el 
único método que puede utilizarse a la hora de remuestrear capas de información 
categórica. Podemos ver claramente esto en la figura 14.20. Se aprecia que en la 
capa remuestreada mediante interpolación bicúbica aparece un valor no entero 
producto de las operaciones matemáticas aplicadas, frente a los valores enteros 
que representan las categorías en la capa original. Los valores no enteros carecen 
de sentido, y hacen así que la capa remuestreada no sea válida. 

Incluso si no apareciesen valores decimales, el remuestreo de capas categóricas 
por métodos distintos del vecino más cercano es conceptualmente incorrecto, ya 
que la realización de operaciones aritméticas con valores arbitrariamente asignados 
a las distintas categorías carece por completo de sentido. 

Cuando se trabaje con imágenes directamente, es de interés el considerar esta 
misma circunstancia referente a los métodos de remuestreo aplicables en relación 
con la interpretación de la imagen que vaya a llevarse a cabo. La aplicación del 
remuestreo por vecindad es en la mayoría de los casos la opción a elegir, en especial 
cuando se va a proceder a un análisis de la imagen con posterioridad. 
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Figura 14.20: El remuestreo de capas categóricas solo puede llevarse a cabo por vecindad, 
a) capa original, b) remuestreo por vecindad, c) remuestreo mediante splines (incorrecto, 
con valores incoherentes) 

Aun en los casos de variables no categóricas, y aunque la elección del método de 
remuestreo no conduce de por sí a un resultado necesariamente erróneo, el proceso de 
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remuestreo como tal sí que puede hacerlo si no se razona en función de la información 
contenida en la capa. Podemos ver esto claramente en el ejemplo de la figura 14.21. 

La capa original contiene información sobre el número de individuos de una 
especie que han sido encontrados en cada celda, de tal modo que representa la 
densidad de dicha especie. Si se modifica el tamaño de celda para hacerlo el doble 
de grande, la nueva celda tras el remuestreo cubre cuatro celdas de la capa original. 
Mientras que el remuestreo asignará a esa celda un valor promedio de las cuatro 
originales que engloba, el numero de individuos en ella será realmente la suma de 
ellos. Debe aplicarse un factor de reescala que relacione el área de la celda antes 
del remuestreo con el tamaño después del mismo, para así mantener la coherencia 
en el significado de la variable. 
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Figura 14.21: Dependiendo de la variable recogida en la capa, el proceso de remuestreo 
puede requerir operaciones adicionales para obtener un resultado correcto, a) capa con 
valores de conteos (número de individuos) por celda para una especie dada, b) capa tras 
remuestreo (incorrecta), c) capa tras remuestreo y aplicación de factor de reescala (correcta) 


14.4. Formalización y extensión del álgebra de mapas 

Aunque en la práctica los conceptos definidos por Tomlin son la base para la im- 
plementación genérica de algoritmos, diversos autores han intentado extender estos 
conceptos y formalizarlos de una forma más general. Aunque tratar estos sistemas es- 
capa al alcance de este texto, resulta de interés mencionar algunas de las propuestas. 

[197] propone un nuevo álgebra de mapas al que se incorporan predicados 
topológicos y direccionales. Esta definición permite la realización de operaciones 
que el álgebra de Tomlin no contempla, ya que, como demuestran, es un caso 
particular del anterior. 

La propuesta de [198] con su geo-álgebra es distinta, y se encamina a una for- 
malización matemática completa de las operaciones espaciales. En ella, no solo se 


contemplan los datos espaciales, sino también los procesos existentes. Así, se extien- 
de no solo el álgebra de operaciones, sino el concepto de mapa a través de los nuevos 
conceptos de mapa relacional y meta-relacional. La integración de modelos basados, 
por ejemplo, en autómatas celulares, es posible dentro del marco de este geo-álgebra 

Por último, y aunque no relacionada directamente con la información geográfi- 
ca, el álgebra de imágenes definida por [199] guarda una gran similitud debida a la 
parecida naturaleza de los datos ráster y las imágenes como ya hemos comentado. 
Este álgebra de imágenes pretende establecer una notación algebraica con la cual 
expresar los algoritmos del procesado de imágenes, muchos de los cuales comparten 
una base conceptual común con los empleados en el análisis geográfico, y que 
veremos en el capítulo 16. 

14.5. Resumen 

El álgebra de mapas nos proporciona las herramientas necesarias para analizar 
capas ráster y obtener de ellas resultados derivados. Bien sea a partir de una capa, 
de dos, o de una batería de ellas, las funciones del álgebra de mapas definen un 
marco formal de procesos dentro del cual desarrollar los más diversos análisis. 
Distinguimos cuatro tipos básicos de funciones: locales, focales, zonales y globales. 

De cada uno de ellos veremos numerosos ejemplos de aquí en adelante, ya que 
constituyen la base conceptual sobre la que se construyen la práctica totalidad de 
algoritmos de análisis de capas ráster. Estas funciones han de ir unidas a un manejo 
adecuado de las variables de entrada (las capas ráster), así como a una serie opera- 
dores que se aplican sobre las celdas que cada función define como objeto de análisis. 


Capítulo 15 


Geomorfometría y análisis del terreno 


A lo largo de este capítulo estudiaremos aquellas formulaciones que tienen que ver 
con los Modelos Digitales de Elevaciones como capa base de análisis. En primer lugar, 
estudiaremos con más detalle el MDE como fuente básica de información, la forma de 
crearlo, sus características propias y la forma de prepararlo para el análisis. Después, 
veremos como extraer información a partir de él. 

Para estudiar este capítulo deberás tener un buen entendimiento del álgebra de mapas, 
ya que sus fundamentos se aplican de forma intensa en todos los análisis que vamos a ver, y 
se da por supuesto que los conoces suficientemente. De igual modo, un cierto conocimiento 
sobre hidrología de superficie te servirá para comprender mejor la segunda parte del capítulo, 
aunque en este caso se dan breves explicaciones de los conceptos hidrológicos básicos. 


15.1. Introducción 

Si es cierto que una inmensa parte de la información que manejamos es suscepti- 
ble de ser georreferenciada, y ello justifica la necesidad de los SIG como herramien- 
tas, no es menos cierto que, de los procesos que estudiamos en un SIG, la gran mayo- 
ría requieren un conocimiento exhaustivo de la superficie sobre la que se desarrollan. 
Puesto que las actividades humanas se asientan en su práctica totalidad sobre la su- 
perficie terrestre, estudiar cualquier fenómeno asociado a ellas sin tener en cuenta es- 
ta implica estar dejando fuera una gran cantidad de información sumamente valiosa. 

Este hecho concede por sí solo importancia a este capítulo, pues todas las disci- 
plinas hacen uso de uno u otro modo de los resultados que en él veremos. Asimismo, 
justifica el hecho de que el Modelo Digital de Elevaciones (MDE) sea, con toda 
probabilidad, la capa de mayor importancia de cuantas podemos incorporar a 
cualquier análisis, ya que no solo su ámbito de utilidad es amplísimo, sino que, como 
veremos, el número de resultados que podemos obtener de su análisis es igualmente 
variado y abundante. De este modo, su versatilidad es tal que en prácticamente 
todas las situaciones será de interés el incorporar a un proceso de análisis bien el 
MDE directamente o bien alguna de las múltiples capas derivadas de este. 

El estudio del terreno y la parametrización de sus características es, por tanto, 
pieza fundamental del análisis geográfico. La disciplina encargada de llevar a cabo es- 
te análisis es la geomorfometría, la cual se define como la «ciencia del análisis cuanti- 
tativo del relieve» [200, 201 , 202] . La geomorfometría es una ciencia multidisciplinar 
con base en la geología, la geomorfología, la topografía, la matemática y otras muy 
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diversas ramas de conocimiento. Esto no es de extrañar considerando lo anterior- 
mente mencionado, ya que son muchas las disciplinas que han dedicado sus esfuerzos 
al análisis del relieve y el estudio de sus implicaciones sobre los distintos procesos. 

Puesto que nos encontramos dentro del marco de los Sistemas de Información 
Geográfica, centraremos el contenido del capítulo en los aspectos de la geomorfo- 
rnetría que atañen a la utilización del MDE como fuente de información principal, 
así como en las formulaciones de análisis con base informática. 

Por su especial relevancia, dedicaremos la primera parte del capítulo a tratar en 
profundidad los MDE como capas de datos particulares. Detallaremos tanto la crea- 
ción del MDE como su preparación y tratamiento, con el objetivo de disponer de una 
capa de calidad acorde con las múltiples operaciones que sobre ella vamos a realizar. 

Resumiendo el conjunto de análisis geomorf ométricos, la aplicación de estos 
puede estructurarse en las siguientes etapas [103]: 

1 . Toma de datos de elevación en puntos establecidos (muestreo) . 

2. Generación de un modelo de la superficie a partir de los anteriores. 

3. Corrección de errores y eliminación de elementos erróneos. 

4. Cálculo de parámetros y elementos derivados. 

5. Empleo de los parámetros y elementos anteriores. 

Los dos primeros puntos no son estrictamente necesarios, puesto que ya hemos 
visto que puede obtenerse directamente un MDE a partir de tecnologías como el Li- 
DAR, que hace innecesario tanto la toma de datos puntuales como la interpolación 
en base a estos. En caso de que esta última se lleve a cabo, ya vimos en el capítulo 
13 las distintas técnicas existentes, aunque en este ampliaremos esa información 
para tratar las consideraciones específicas que deben tenerse en cuenta cuando 
la variable interpolada es la elevación. 


15.2. El Modelo Digital de Elevaciones 

El Modelo Digital de Elevaciones es la pieza clave del análisis geomorfomé- 
trico. Es el equivalente informatizado de la cartografía clásica de elevaciones 
tradicionalmente representada mediante curvas de nivel. 

El MDE supone un enorme salto cualitativo frente a sus predecesores, ya que la 
utilización de un modelo numérico en lugar de uno gráfico permite una diferencia 
conceptual de análisis superior en este caso a la que tiene lugar con otras capas 
de información. El MDE se convierte así en una fuente de información de primer 
orden para el estudio del medio. 

Conviene, antes de proseguir, aclarar algunos apartados en relación con la 
terminología empleada. Como en tantos otros campos, en este que tratamos ahora 
también existen discrepancias sobre el significado de los términos utilizados, que 
frecuentemente llevan a equívocos y confusiones. En relación con la cartografía di- 
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gital de elevaciones, estos vienen motivadas por el empleo de dos términos distintos: 
Modelo Digital de Elevaciones (MDE) y Modelo Digital del Terreno (MDT). 

Dentro de este texto consideraremos que un MDT es una «estructura numérica 
de datos que representa la distribución espacial de una variable cuantitativa y 
continua» [203], mientras que un MDE es un caso particular dentro de los MDT 
en el cual la variable recogida es la elevación. 

El concepto de MDT, como vemos, es más genérico y no ha de guardar relación 
alguna con el relieve, puesto que, atendiendo a la definición anterior, podemos 
recoger variables tales como temperatura o la humedad en un punto dado, y hacerlo 
mediante un MDT. Tendríamos, por ejemplo, un Modelo Digital de Temperaturas. 
Expresado de otro modo, el MDT no es sino una capa con información continua 
como por ejemplo la relativa a elevaciones, aunque pudiendo recoger cualquier 
otra variable con esas características. 

El empleo de la palabra terreno da lugar a que, con frecuencia, MDT y MDE sean 
empleados erróneamente como sinónimos en el uso diario de capas de elevaciones e 
incluso en el ámbito más científico. En otros casos, por el contrario, sí se especifica 
una diferencia entre ambos conceptos, aunque esta no coincide con lo anterior. 
Algunos autores consideran que tanto el MDT como el MDE tienen relación con 
la elevación pero, mientras que el MDT recoge la elevación máxima en cada punto, 
incluyendo los elementos presentes tales como edificios, arboles, etc., el MDE recoge 
la información de la superficie sin tener esto en cuenta, en algo que podríamos de- 
nominar un Modelo Digital de la Superficie. Esta interpretación es más habitual en 
lengua inglesa, aunque las acepciones también varían e incluso llegan a ser completa- 
mente contrarias, asignando al MDE las características del MDT y viceversa [204], 

Aunque no han de ser necesariamente recogidos en formato ráster, los MDE gene- 
ralmente se entienden por definición como entidades ráster e incluso algunos autores 
así lo reflejan explícitamente. Para [177], por ejemplo, un MDE es «una representa- 
ción matricial regular de la variación continua del relieve en el espacio» . Al igual que 
ya vimos en el capítulo 14 para el caso del álgebra de mapas genérico, la estructural 
regular de una malla ráster favorece la implementación de algoritmos de forma efi- 
ciente y sumamente más sencilla. Los algoritmos de análisis geomorfométrico no son 
una excepción a esto, y las formulaciones para capas ráster son mucho más abundan- 
tes que las basadas en otros modelos de almacenamiento, existentes de igual modo. 

Junto a la información desarrollada en el capítulo 5 acerca de los distintos 
modelos de representación espacial, podemos ampliar esta y ver cómo dichos 
modelos se adaptan de modo particular a la representación del relieve. 

Los formatos vectoriales tales como la representación mediante curvas de nivel 
son menos adecuados, ya que, como se dijo, no son óptimos para recoger variables 
de tipo continuo. Aunque interesantes para representar visualmente superficies 
continuas, no lo son tanto para su análisis, y las formulaciones existentes a este 
respecto dentro del análisis geomorfométrico son pocas. 

Las redes de triángulos irregulares (TIN) son una forma mejor de recoger el 
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relieve. No obstante, la implementación de algoritmos de análisis basados es TIN 
es más compleja y, por ello, menos frecuente. Los paquetes de software habituales 
no incluyen estas, por lo que en la práctica el análisis de un MDE en formato TIN 
es difícil de llevar a cabo. 

El formato más adecuado, tanto por sus características como por la facilidad 
con la que permite la implementación de algoritmos, es el formato ráster, y será 
en este formato en el que se basen los análisis siguientes. 

Las características de una capa ráster que definen la aplicabilidad de este para 
un determinado análisis son sus resoluciones vertical y horizontal. En el caso del 
MDE, estos parámetros han sido ampliamente estudiados, así como su efecto en los 
resultados producidos a partir de dicho MDE. En [205] y [206] puede encontrarse 
más información al respecto 

15.3. Creación y preparación del MDE 

En muchas ocasiones, la información de elevaciones no se encuentra como una 
capa ráster. Puesto que la mayoría de las herramientas de análisis se basan en este 
formato y el número de formulaciones aplicables es mucho mayor, se asume que 
el trabajo con un MDE dentro de un SIG con el objeto de llevar a cabo un análisis 
pormenorizado de este requiere disponer de una capa ráster de elevaciones. 

Esta capa puede obtenerse a partir de la forma original en la que se encuentren 
los datos de elevación, haciendo uso de las diversas metodologías tales como los 
métodos de interpolación ya vistos. 

Tanto si generamos la capa ráster como si la obtenemos directamente ya en este 
formato, es habitual que esta no se encuentre en las condiciones idóneas para ser 
sometida a todos los análisis que veremos en este capítulo. Será necesario trabajar 
sobre ella y prepararla para que sirva como una fuente de información fiable a la 
hora de obtener nuevos descriptores del terreno. 

Tanto la creación como la preparación del MDE son fases importantes que han 
de ser cuidadosamente llevadas a cabo. 

15.3.1. Creación del MDE 

La creación del MDE implica en la mayoría de casos la utilización de métodos de 
interpolación. Un caso muy habitual es la creación a partir de curvas de nivel, con 
cuyos valores puede obtenerse una capa continua de elevaciones. También puede 
obtenerse a partir de datos puntuales tomados en campo, caso que es frecuente 
para estudios donde es necesaria una gran precisión, y en los que la cartografía 
existente no es suficiente, debiendo elaborarse esta. 

La naturaleza de la información que se recoge en el MDE y el análisis a efec- 
tuar posteriormente con él hacen interesantes los siguientes comentarios sobre los 
distintos métodos de interpolación. 
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■ Distancia inversa. El método de distancia inversa no es adecuado para 
la interpolación de MDE, pues genera abundantes depresiones de carácter 
artificial (ver 15.6.2) y elementos no naturales en el relieve. 

■ Kriging. Pese a ser un interpolador de calidad para el caso de datos de 
elevación, las superficies generadas son excesivamente suaves. Aunque la 
precisión del método es alta en términos cuantitativos, no refleja con pre- 
cisión la configuración del relieve y sus accidentes, lo cual se hará notar en 
los análisis posteriores sobre dicho MDE. 

Otro problema del kriging es su excesiva sensibilidad a valores extremos 
estadísticamente diferentes del resto, ya que producen un número elevado de 
elementos morfológicos erróneos [103], dificultando la aplicación posterior 
de ciertos algoritmos. 

■ Splines. Los splines representan una de las mejores alternativas para la 
creación de MDE. Frente a las restantes metodologías, autores como [181] re- 
comiendan el uso de splines para la obtención de MDE idóneos para el análisis. 

■ Ajuste de funciones. Como métodos globales, ajustar una función de tipo 
polinómico a los puntos de datos y asemejar el relieve a esta no es adecuado, 
ya que el relieve es altamente más complejo . El uso de funciones de grado 
superior y mayor complejidad, por otra parte, hace que puedan aparecer 
valores extremos irreales que desvirtúen por completo la superficie interpola- 
da (ver 13.2.3). Aplicados como métodos locales, no obstante, veremos más 
adelante que este tipo de ajustes se utilizan no para la creación del MDE sino 
para el análisis de las propiedades de este, ajustando localmente funciones 
con los valores de un entorno definido de celdas. 

Las anteriores son características generales de los métodos que, no obstante, 
pueden ser consideradas de una u otra forma según sea el terreno a interpolar. Así, 
si el kriging adolece de una excesiva suavidad en la forma de la superficie calculada, 
no será un buen método para zonas montañosas con relieves escarpados. Si conoce- 
mos, sin embargo, que el relieve de la zona a interpolar es suave y redondeado, las 
deficiencias del kriging no serán tales en este caso. Una vez más, el conocimiento 
de la variable interpolada es un elemento básico para la aplicación correcta de uno 
u otro método. 

Es de interés reseñar que los problemas en el MDE que hacen necesaria la 
preparación de este antes de su análisis vienen derivados de deficiencias no cuan- 
titativas sino especialmente cualitativas, donde las formas del relieve recogidas 
no se corresponden con las reales. Por ello, es importante que el MDE generado 
refleje correctamente la conformación de la topografía, además de disminuir el 
error cuantitativo, puesto que la precisión cualitativa es en muchos casos de mayor 
importancia para obtener con posterioridad resultados correctos [207]. En este 
sentido, existen métodos particulares específicamente diseñados para la creación 
de MDE, cuyos resultados son más adecuados para un análisis directo y no re- 
quieren parte de la preparación que se hace necesaria al aplicar otros métodos de 
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interpolación. Esto es así debido a que los fundamentos de esta se incorporan ya 
en el proceso de interpolación y cálculo de nuevos valores. 

El más destacable de estos métodos es ANUDEM [208] , que toma como partida 
datos en forma de curvas de nivel. Además de utilizar los valores de elevación para 
interpolar, analiza la forma de las curvas de nivel para derivar otros resultados que 
sirven de apoyo. Asimismo, puede aportarse información adicional tal como la red 
de drenaje existente, en caso de que se disponga de ella, o los límites de barrancos 
u otras zonas donde el relieve no presente continuidad. Todo ello garantiza el buen 
comportamiento del MDE en el análisis posterior y su coherencia hidrológica. 


15.3.2. Preparación del MDE 

La preparación del MDE hace referencia al filtrado de este para eliminar las 
posibles deficiencias que contiene, y muy especialmente a los elementos relaciona- 
dos con el análisis hidrológico. En el primer caso, se trata de eliminar información 
incorrecta presente en el MDE, mientras que en el segundo caso se trata de tra- 
bajar con elementos de este que dificultan la aplicación de ciertas formulaciones 
y algoritmos. Estos elementos no tienen que ser necesariamente erróneos 

En términos generales, los objetivos que se persiguen con la preparación del 
MDE son: 

■ Eliminación de errores groseros 

■ Descripción más precisa del relieve 

■ Descripción más precisa de los procesos hidrológicos y ecológicos que tienen 
lugar. 

La corrección de los valores del MDE enfocada a estos dos primeros objetivos 
incluye muchos factores distintos que han de tenerse en cuenta. Entre ellos, cabe 
mencionar. 

■ Errores incorporados por las distintas fuentes de datos o el instru- 
mental empleado para la recogida de los mismos, así como por las metodo- 
logías empleadas en el proceso de estos (por ejemplo, las distintas técnicas 
de interpolación). Pueden corregirse conociendo las deficiencias de cada una 
de ellas, que dan información sobre el tipo de errores que pueden aparecer 

■ Presencia de valores discrepantes muy improbables ( outliers ). Estos 
pueden eliminarse mediante técnicas estadísticas, en función de los valores 
de las celdas vecinas [209] . La aplicación de métodos geoestadísticos como 
el kriging permite igualmente la estimación del valor esperado en una celda 
a partir de los valores de las circundantes. 

■ Presencia de zonas sin datos. Especialmente relevante en el caso de MDE 
procedentes de teledetección, ya que pueden existir zonas vacías por errores 
de captura, o bien por ser combinación de varias imágenes entre las que 
existen áreas no cubiertas. Estas zonas vacías pueden rellenarse mediante 
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métodos de interpolación, siempre que estas no impliquen extrapolación y 
excedan de un tamaño máximo lógico. 

Para una descripción más detallada de estas metodologías puede consultarse 
[103] - 

Además de la corrección de valores, la mayor parte de la preparación del MDE, 
imprescindible en muchos casos, es sin embargo de tipo hidrológico. Esta debe 
llevarse a cabo cuando vayamos a analizar parámetros que tengan relación con 
el comportamiento hidrológico de las celdas, y más concretamente todas aquellas 
que empleen algún algoritmo de asignación de direcciones de flujo de los que más 
adelante veremos. 

La preparación del MDE corrige este comportamiento para solventar los dos 
principales problemas que se presentan a la hora de asignar direcciones de flujo: la 
presencia de zonas llanas y la existencia de depresiones. Ambos elementos hacen 
imposible el análisis hidrológico en aquellas zonas en las que aparecen, siendo 
necesario corregirlas previamente. 

Para una mejor comprensión de las formulaciones que permiten corregir la 
presencia de zonas llanas o depresiones, es necesario conocer con anterioridad los al- 
goritmos de dirección de flujo, ya que son estos los afectados por ellas. Por esta razón, 
veremos las soluciones a estos problemas en una sección posterior de este capítulo. 

15.4. Modelos matemáticos locales del MDE 

Gran parte de los análisis que vamos a realizar a partir del MDE tienen una 
base matemática. Conceptos tales como la pendiente o la orientación de una 
superficie en un punto dado pertenecen al ámbito de la geometría diferencial, y la 
aplicación de estos a la superficie recogida en un MDE requiere una caracterización 
matemática del mismo. 

Sea una función que represente a nuestro Modelo Digital de Elevaciones, de 
la forma. 


z = f{x,y ) (15.4.1) 

donde x e y representan las coordenadas respectivas en los ejes xey del plano hori- 
zontal, y z la elevación en el punto definido por dichas coordenadas. De existir una 
función como esta y poder disponerse de una expresión explícita de ella, contendría 
en sí toda información del MDE. Sin embargo, parece lógico pensar que, como ya se 
menciono al tratar el ajuste de funciones como método de interpolación, las formas 
naturales del relieve no son definibles con dicha sencillez dada la complejidad de este. 

Para poder dar una caracterización matemática al MDE debemos hacerlo 
localmente, utilizando una función distinta para cada celda. Acudiendo a los 
conceptos del álgebra de mapas, emplearemos una función de análisis focal que, 
dada una celda, toma un entorno reducido de esta y describe dicho entorno con 
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una expresión matemática ajustada a este. La extensión limitada de la ventana 
de análisis hace que no sea irreal el pretender ajustar dicha función, como lo era 
en el caso de hacerlo para todo el MDE. 

Las funciones más habituales son las de tipo cuadrático, que garantizan en mayor 
medida la corrección de los resultados derivados, tales como pendientes [ 210 ] o cur- 
vaturas [ 2 1 1 ] (veremos en breve qué significan estos parámetros y cómo se calculan) . 


f(x;y) = ax 2 y 2 +bx 2 y+cxy 2j t-dx 2 +ey 2 + fxy+gx+hy+k (15.4.2) 

[19] propone el caso particular 

tx 2 ty 2 

z=-^- + sxy+ — +px+qy+zo (15.4.3) 

Con seis parámetros que calcular, la ventana habitual 3x3, con nueve valores, 
es suficiente para llevar a cabo un ajuste por mínimos cuadrados. Empleando la 
notación introducida en 14.2.2 para dicha ventana, los valores de los parámetros 
quedan determinados de la siguiente forma: 


P 

Q 

r 

s 

t 


zo 


Z3 + Z 6 + Z 9 -Zi-Z4-Z 7 

6 A s 

Z1+Z2+Z3-Z7-Z8-Z9 

6 A s 

Zl + Z 3 + Z 4 + Zq + Z 7 + Zg — 2(^2 + ¿5 + z 8 ) 

3As 2 

-Z 1 -hZ 3 + Z 7 -Zg 

4As 2 

Zl + Z 2 + Z 3 + Z 1 7 + Zs + Zg — 2 ( Z 4 + £5 + Zq ) 

3A s 2 

5Z5 + 2(Z2 + Z 4 + Ze + Zs)-(Z 1 + Z 3 + Z 7 + Zg ) 

9 


siendo As el tamaño de celda. 

Mientras que la superficie definida por esta función no ha de pasar necesaria- 
mente por ninguna de las celdas, [ 212 ] propone utilizar la expresión completa de 
15.4.2, que expresaremos como sigue para que los cálculos posteriores resulten más 
sencillos: 


TX tV 

z = Ax 2 y 2 +Bx 2 y+Cxy 2 + ^-+sxy+ — +px+qy+D (15.4.5) 

Esta función, ajustada mediante polinomios de Lagrange, sí garantiza que la 
superficie pase exactamente por los puntos de la ventana de análisis. 

En este caso, los valores de los coeficientes son los siguientes: 
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p 

q 

r 

s 

t 

A 

B 

C 

D 


ZQ-Z4 

2A s 
Z2-Z8 
2A s 

Z4+z e -2-z 5 

A? 

-Zl + Z 3 + Z 7 -Z 9 

4As 2 

£2+2:8-22:5 

As 2 

(zi + Z3 + Z 7 + Zg) — 2(Z2 + Z4 + Zq + Zg) + 4 - Z5 

4A s 4 

(■ Z 1 + Z 3 -Z 7 -Zg)- 2 (z 2 -Z 8 ) 

4As 3 

(-zi + z 3 -z 7 -hzg) - 2 (z 6 -Z4) 

4As 3 


(15.4.6) 


Junto a las anteriores, probablemente las más habituales, encontramos otras 
como [213] , idéntica a la de [19] salvo por el hecho de que obliga a la función a pasar 
por la celda central, o [214], así como funciones de orden superior o bien ajustes de 
planos en lugar de superficies cuadráticas [215]. Igualmente, puede generalizarse 
lo anterior al empleo de polinomios de grado n [194]. 

Independientemente del método empleado, disponemos de una caracterización 
matemática del relieve a nivel local, lo cual nos permite ya aplicar las herramientas 
matemáticas con las que obtener valores derivados. 


15.5. Análisis morfométrico 

El análisis morfométrico del MDE estudia el relieve y la orografía de la superficie 
por este definida, caracterizándolo a través de parámetros adicionales. Recurriendo 
una vez más a los conceptos del álgebra de mapas, estos parámetros se basan 
en su gran mayoría en un análisis focal. Este análisis emplea la caracterización 
matemática que vimos en el punto anterior, así como formulaciones estadísticas 
sencillas. En función de ello distinguimos dos grupos principales: 

■ Medidas geométricas 

■ Medidas estadísticas 

Puesto que la mayoría de análisis son de tipo focal, se necesita definir una venta- 
na de análisis. El tamaño de esta ventana depende del tipo de medida a calcular. En 
el caso de medidas estadísticas, esta puede escogerse libremente, así como su forma. 
En el caso de las medidas geométricas, estas requieren de un modelo matemático 
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del terreno, por lo que la ventana de análisis viene condicionada al modelo escogido. 
En realidad, una vez establecida la función que define localmente la superficie del 
MDE, hacemos uso directo de su expresión, motivo por el cual, según sea el modelo, 
se usarán unos u otros valores de los pertenecientes a la ventana de análisis. 

15.5.1. Medidas geométricas 

Las medidas geométricas derivan de la caracterización matemática local del 
relieve, sobre la cual se aplican conceptos fundamentales de geometría diferencial. 
Estas medidas describen las propiedades geométricas de la porción de relieve 
contenida en la ventana de análisis. 

Los conceptos subyacentes son los mismos para todos los modelos del terreno, 
aunque, lógicamente, producen resultados distintos. 

Existen formulaciones no basadas en un análisis matemático del terreno [216], 
aunque nos centraremos en aquellas con una base matemática, por su mayor 
idoneidad. Estas formulaciones que no hacen uso de la caracterización matemática 
local del terreno permiten obtener valores de pendiente y orientación, pero no de 
otros parámetros tales como curvaturas. 

Medidas basadas en derivadas de primer grado 

Los parámetros geométricos más básicos parten del estudio de las derivadas 
parciales de primer orden de la superficie, y se obtienen a partir del gradiente de 
la superficie. El gradiente es un concepto básico del cálculo vectorial y se expresa 
en función de las antedichas primeras derivadas parciales, según 


Dado un campo escalar tal como el representado por el MDE, el gradiente es un 
campo vectorial orientado en la dirección en la que el campo escalar experimenta 
una mayor variación. 

Las dos propiedades principales que podemos obtener del gradiente son dos: su 
longitud o módulo y su dirección. Estas propiedades, considerando la interpretación 
geomorfométrica que le damos por calcularse a partir del MDE, constituyen dos 
de los parámetros más importantes que pueden extraerse de este: la pendiente y 
la orientación. 

La pendiente refleja la variación máxima de la elevación y se define en función 
del gradiente como 



(15.5.1) 


s = arctan(|VZ|) 


(15.5.2) 


Este valor representa el ángulo entre el plano horizontal y el tangencial a la 
superficie en el punto considerado. Este último queda definido por el gradiente, 
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que es normal al mismo. El horizontal es, a su vez, normal a la curva de nivel que 
pasa por el punto. 

La pendiente obtenida de la expresión anterior viene expresada en unidades 
angulares tales como radianes o grados, aunque es habitual hacerlo en porcentaje. 
Para ello, utilizamos la expresión 


s = tan(s)-100 


(15.5.3) 


Si utilizamos el modelo matemático de [19], derivando la expresión dada 
obtenemos: 


2 , 2 

d:z ~ d(^ r +sxy+ \+px+qy+zo) 

dx dx 

2 , 2 

dz ~ d(^ r +sxy+- 1 t-+px+qy+z 0 ) 
dy dy 


-rx+sy+p 


= ty+sx+q 


(15.5.4) 

(15.5.5) 


El valor que buscamos es el de la celda central, que representa el origen de 
coordenadas. Por tanto, x = y = 0, y según 15.4.4 tenemos que 


dz 

Z 3 + Z e + Z 9 -Zi-Z4,-Z 7 

(15.5.6) 

P dx 

6- As 

dz 

Zi+Z2 + Z 3 -Z 7 -Z8-Zg 

(15.5.7) 

q dy 

6- As 


Con estos valores ya tenemos el vector gradiente, y aplicando la ecuación 15.5.2 
obtenemos el valor de la pendiente en la celda. 


s = ar ctan ( \J p 2 + q 2 ) 


(15.5.8) 

Si empeamos en su lugar el modelo introducido en 15.4.5, derivando y haciendo 
x = y = 0 , se obtiene también que 


dz 

dx 


dz 

dy 


Y según 15.4.6 


dz 

dx 

dz 

dy 


¿ 6-¿4 

2As 

Z2-Z& 

2A s 


(15.5.9) 

(15.5.10) 

(15.5.11) 


Como ejemplo, el mapa de pendientes resultante de utilizar esta última for- 
mulación puede verse en la figura 15.1. 

Podemos expresar ambas formulaciones como el resultado de convoluciones 
(ver 14.2.2), mediante un núcleo. Por ejemplo, las parciales según la metodología 
de [19] se corresponden con los núcleos siguientes: 
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Figura 15.1: Mapa de pendientes obtenido a partir del MDE 


1 

0 

1 

-6 AS 

6 As 

1 

0 

1 

-6 AS 

6 AS 

1 

0 

1 

-6 AS 

6 AS 


1 

1 

1 

-6 As 

-6 As 

-6 As 

0 

0 

0 

1 

1 

1 

6 As 

6 As 

6 AS 


Como ya sabemos, la estructura ráster del MDE es similar a la de una imagen 
digital. Esto hace que no solo sea sencillo combinar el MDE con imágenes aéreas 
o satelitales, sino que también en las técnicas y algoritmos existe una notable 
similitud. En particular, veremos más adelante en el capítulo dedicado al análisis 
de imágenes que los núcleos anteriores se conocen como núcleos de Prewitt y son 
frecuentemente utilizado para la detección de bordes. 

Muy relacionado con la pendiente, encontramos otro parámetro muy sencillo: 
la superficie real de una celda. Si tenemos una capa con un tamaño de celda 
As, el área ocupada por la misma será A = (As) 2 . No obstante, se trata de un 
área planimétrica, ya que en ningún momento consideramos que la celda tiene 
inclinación. Este área no se corresponde con, por ejemplo, el área real que se 
encuentra disponible para los seres vivos que habitan en esa celda, pues esta 
debería considerar la influencia de la pendiente. 

La manera más sencilla de calcular el área real de una celda es empleando la 
siguiente fórmula [217]: 
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A' = 


A 

eos (s) 


(15.5.12) 


La simplicidad de la fórmula, sin embargo, hace que, por regla general, el área 
quede sobreestimada [218], al contrario que en el caso de utilizar directamente 
el área planimétrica. [219] propone como alternativa el utilizar el conjunto de 
triángulos tridimensionales que se establecen entre la celda central y cada una 
de las adyacentes, y sumar las áreas de todos ellos. De este modo, se obtiene una 
aproximación más realista. 

Junto con la pendiente, la orientación es el otro parámetro básico que calculamos 
a partir del gradiente. Esta queda definido como [220]: 


a= 180— arctanf - ) +90^ (15.5.13) 

\PJ \P\ 

siendo p y q las derivadas parciales en las dos direcciones x e y, según la notación 
que venimos empleando. 

El resultado viene expresado en grados sexagesimales. Se considera por con- 
vención que el Norte marca la orientación cero, aumentando los valores en sentido 
horario. 

La formula anterior no se encuentra definida en aquellas celdas para las cuales 
dz/dy = 0. [221] propone utilizar en su lugar la siguiente fórmula: 


a = - 90 • [1 - sign (q)] • [1 - |sign(p) |] 

180 

+ 180 • [1 +sign(p)] sign(p) 

7T 


(15.5.14) 


• árceos - 


vV 2 +<? 2 

siendo sign(x) la función definida por 


sign(x) = 


1 

0 

-1 


si x>0 
si x = 0 
si x<0 


(15.5.15) 


En este caso, la orientación no esta definida cuando la pendiente es nula. 

El mapa de orientaciones para la zona del juego de datos de referencia se 
muestra en la figura 15.2. 

Es de reseñar que la orientación es un parámetro circular, ya que a y a+360° indi- 
can la misma dirección. Por esta razón, debe tenerse cuidado al realizar análisis esta- 
dísticos sobre los valores de orientación. Una posible solución que elimina este hecho 
es trabajar con las proyecciones eos (o) y sin(a) [222] (ver 12.3) . También a la hora de 
crear una representación gráfica de un mapa de orientaciones debe tenerse en cuenta 
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Figura 15.2: Mapa de orientaciones obtenido a partir del MDE. 


la naturaleza circular del parámetros. Nótese como en la figura 15.2 la escala de colo- 
res también es circular, de tal modo que el valor máximo (360) tiene asociado el mis- 
mo color que el mínimo (0), ya que en realidad representan una misma orientación. 

Tanto la orientación como pendiente pueden representarse de modo simultaneo 
no como una capa nueva de valores, sino mediante elementos vectoriales (líneas) 
que representen el gradiente, las cuales pueden acompañar a la propia capa de 
elevaciones a partir de la cual se calculan (Figura 15.3). Es de interés reseñar que, 
aunque la pendiente y la elevación son habitualmente aplicadas a una capa de 
elevaciones como todos los restantes parámetros que vemos en este capítulo, no ha 
de limitarse su aplicación a estas. Para cualquier otra variable de la cual queramos 
ver cómo varía en el espacio, ambos parámetros son perfectamente aplicables. 

Como veremos más en detalle en las próximas secciones, la orientación tiene 
relación directa con el comportamiento de los flujos sobre el terreno y sirve por 
tanto para el análisis hidrológico. Los análisis que veremos son de tipo regional, 
aunque la orientación puede usarse también en análisis focales para definir pará- 
metros relacionados con el comportamiento hidrológico, tales como el índice de 
convergencia [223]. Una representación de este índice se encuentra en la figura 15.4. 

Otro de los usos habituales de los MDE es el relativo a la insolación. Tradi- 
cionalmente, la propia orientación se ha utilizado para evaluar si una zona se 
encuentra situada en solana o en umbría. Con la mayor potencia que el cálculo 
basado en un MDE nos brinda, podemos obtener resultados más precisos. 

Una primera aproximación mediante un modelo sencillo se obtiene combinando 
los valores de orientación y pendiente en los denominados relieves sombreados. 
Estos mapas intentan reflejar la topografía del MDE de forma más realista, consti- 
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Figura 15.3: Representación del gradiente mediante elementos lineales. Para una mejor 
interpretación se han añadido curvas de nivel cada 10 metros. 



Figura 15.4: Indice de convergencia. 


tuyendo además representaciones muy intuitivas. Por esta razón, se han empleado 
para resaltar otros mapas y enriquecerlos visualmente [214], tal y como puede 
verse en la figura 15.5. Empleando transparencias, puede reflejarse en una única 
imagen la información de una capa ráster y el relieve subyacente. 

Para una posición dada del Sol definida por su azimut 4> y su elevación sobre 
el horizonte 9 , la insolación sobre una celda de pendiente s y orientación a viene 
expresada por la ecuación [224]: 


F = 


100tan(s) "sin(0) 

^l+tan 2 (s) ^ tan ( s ) 


cos(0)sin((/>— a) 


(15.5.16) 
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Figura 15.5: Utilización de una capa de relieve sombreado para mejorar la visualización 
de una imagen aérea 


Los valores se sitúan en el rango 0-100. La capa resultante puede emplearse 
no solo para mejorar visualmente otras, sino, por ejemplo, para corregir el efecto 
del relieve en imágenes de satélite. [225] [203]. 

El modelo de insolación anterior es muy simple y puede mejorarse notable- 
mente. Por una parte, para reflejar realmente la insolación debemos considerar 
las sombras que pueden proyectar otros elementos del relieve situados entorno a 
la celda considerada. Es decir, el estudio riguroso de la insolación no puede ser un 
análisis focal. Por otra parte, los valores sin unidades en el rango 1-100 que son 
válidos para la mejora visual de otras capas, serían mucho más útiles para otras 
aplicaciones si contuvieran información en unidades reales de energía radiante. 
Y por último, esta energía radiante debería poder expresarse no soló instantánea 
para una posición dada del Sol, sino acumulada a lo largo de un periodo de tiempo 
tal como un día, una estación o un año completo. De este modo, sería mucho más 
útil para, por ejemplo, desarrollar modelos de desarrollo de especies vegetales o 
animales, que guardan una relación directa con la energía solar recibida. 

Respecto al estudio de la insolación no como un parámetro local, sino teniendo 
en cuenta las sombras causadas por el relieve circundante, se aplican análisis de 
visibilidad para ver si existe conexión visual entre el Sol y una celda dada o, por 
el contrario, el relieve bloquea la línea de visión. En 15.7 se detallará lo necesario 
para llevar a cabo este análisis. 

En la figura 15.6 puede verse esto gráficamente. 

Para analizar la insolación a lo largo de un periodo dado, basta dividir este 
en intervalos y estudiar la posición del Sol en cada uno.de ellos. Los ángulos ó y 
6 se obtienen en cada instante a partir de modelos astronómicos sencillos. En [226] 
se encuentran detalladas las expresiones correspondientes. Del análisis de todos 
esos intervalos obtenemos el tiempo de insolación total como suma del de todos 
los intervalos en los que el Sol es visible desde la celda, así como un valor total de 
insolación como suma de las energías recibidas en ellos. 

Para estimar dicha energía correspondiente a un intervalo, estudiamos las 
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Figura 15.6: Zonas en sombra (a) frente a zonas bajo insolación (b), por comparación 
entre el perfil del terreno y la línea de visión entre la celda problema y el Sol. 


pérdidas de energía debidas a la transmisión desde el Sol a la Tierra, y las corres- 
pondientes al relieve. 

Comenzando partir de la magnitud E de la misma recibida en el exterior de 
la atmósfera, se puede calcular la recibida por una superficie plana — es decir, 
horizontal — situada a una altura h sobre el nivel del mar, según los pasos siguientes. 

Se tiene que 


E = Eo(l +0,034cos(360d/365)) (15.5.17) 

donde Eq es la conocida constante solar de valor 1367W m -2 y d el número de día 
del año. 

El paso por la atmósfera reduce el valor de E según 

E' = Er Mh (15.5.18) 

donde r es la transmisividad del aire, generalmente de valor r = 0,6, y M ^ la masa 
del aire, la cual se evalúa de acuerdo con la expresión 

M h = M 0 C p (15.5.19) 

siendo 

Mq = \J 1229+(614sina 2 ) — 614sina 

_/ 228 -0,0065/?. \ 5 ’ 256 
Cp ~{ 288 ) 

Por último, el relieve de la celda modifica la energía recibida según 


(15.5.20) 

(15.5.21) 


E" = E'cosa 


(15.5.22) 
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El valor de cosa se calcula a partir de las orientaciones y pendientes tanto del 
Sol como de la celda, haciendo uso de la expresión 


cosa = cos0sins+ eos (ó s — a)sin#coss (15.5.23) 

No obstante, la introducción de factores como la masa de aire añaden una cierta 
subjetividad al modelo al ser datos estimados a su vez a partir de otros parámetros, 
pudiendo restar en cierta medida aplicabilidad a este planteamiento, según casos. 
Junto a esto, otra serie factores tales como el albedo debido a la nubosidad no son 
considerados en el anterior modelo, y serían difíciles de integrar. Y por último, la 
radiación difusa debe considerarse, pues su aporte es relevante [103] 

[203] propone reflejar las diferencias que existen entre cada celda mediante la 
expresión de las energías de modo relativo tomando una referencia válida para 
ello. En particular, es de interés dar las energías como porcentajes de la que sería 
recibida por una superficie horizontal, pues resulta sencillo y altamente operativo 
a efectos de calcular una malla de insolación como la que buscamos. Se define así 
el concepto de índice de radiación , según la expresión 


7rad — ^ ] 


cosa 


^cos(7t/ 2-7 s ) 


(15.5.24) 


Aplicando este concepto al cálculo de la energía en una celda dada, esta puede 
obtenerse para dicha celda, y sobre un intervalo de tiempo dividido en n periodos, 
mediante la expresión 


e=e»E 

Í= 1 


cosa 

COs(7r/2 — 7s) 


(15.5.25) 


Eq es la energía recibida por una superficie horizontal. 

Esta aproximación es sumamente útil si se dispone de datos puntuales proce- 
dentes de piranómetro, ya que, tomando dichos datos como referencia — esto es, 
conociendo el valor exacto de Eq — , se podrían calcular las restantes celdas de la 
malla aplicando la anterior relación. 


Medidas basadas en derivadas de segundo grado 

Las medidas geométricas basadas en derivadas de segundo grado aportan 
información sobre la concavidad o convexidad de la superficie en un punto dado. 
El parámetro que expresa esa información se denomina curvatura. 

Al contrario que sucedía con la pendiente o la orientación, no existe una única 
curvatura, sino un número infinito de ellas. Para definir una curvatura particular 
necesitamos no solo el punto donde calcularla, sino también un plano que corte a la 
superficie en el mismo. Este plano ha de contener al vector normal a la superficie, 
y la intersección de dicho plano con esta da lugar a lo que se denomina una sección 
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normal (Figura 15.7), sobre la cual se estudia la curvatura. La curvatura de la curva 
plana que representa la sección normal es el inverso del radio del circulo que se 
ajusta a la curva en el punto dado (Figura 15.8). Por tanto, tiene dimensiones [L -1 ]. 



Figura 15.7: Una sección normal es la resultante de la intersección de la superficie con 
un plano que contiene al vector normal a esta en un punto. 


Matemáticamente, la curvatura k de la curva z(x) viene dada por: 


d 2 Z 



(15.5.26) 


De entre los planos que pueden tomarse, algunos aportan más información que 
otros. Los planos normales a la superficie que son paralelo y normal a la curva 
de nivel (mutuamente ortogonales) resultan de especial interés. Estos definen, 
respectivamente, las curvaturas denominadas horizontal y vertical. 



Figura 15.8: La curvatura es el inverso del radio (1/1?) del círculo que ajusta a la curva 
en un punto dado. Por convención, es positiva en el caso convexo (1?2 > 0) y negativa 
en el cóncavo ( R\ <0). 

Junto con la notación introducida en 15.5.9, utilizaremos la siguiente para 
simplificar las expresiones: 
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_ d 2 z _ d 2 z _ d 2 z 

dx 2 ’ S dxdy ’ ^ dy 2 ’ 

Derivando tanto la fórmula de [19] como la de [212], y dadas la expresio- 
nes escogidas para estas, se tiene que las derivadas parciales r, s y t coinciden 
respectivamente con los coeficiente r, s y t de aquellas, calculados en la sección 15.4. 

Empleando la notación de 15.5.27, la fórmula de la curvatura vertical es la 
siguiente [19, 227]: 



-p 2 -r+2pqrs+q 2 t 
(p 2 + q 2 )\/(l+p 2 +q 2 ) 3 

Por convenio, las zonas convexas tienen curvatura negativa y las cóncavas 
curvatura positiva. 

En el caso de valores convexos de curvatura vertical, estos indican un aumento en 
la pendiente según se sigue la linea de máxima inclinación. Puesto que esta es la línea 
que marca la dirección del agua al fluir, las zonas con curvatura vertical convexa 
se corresponden con aquellas en las que el agua experimentaré una aceleración. 
Por el contrario, si esta curvatura es cóncava, el agua tenderá a decelerarse. Las 
zonas con curvatura vertical cóncava son zonas con tendencia a acumular agua., 

Para la curvatura horizontal, se tiene [228]: 



kh = - 


q 2 r—pqs+p 2 t 
( p 2 + q 2 )\/l+p 2 + q 2 


(15.5.29) 


La interpretación del significado de esta curvatura podemos realizarla de modo 
similar al caso anterior, en esta ocasión considerando que la sección normal es 
perpendicular a la linea de máxima pendiente. Una curvatura horizontal convexa 
representa una zona en la que el flujo tiende a dispersarse, mientras que si es 
cóncava el flujo tiende a concentrarse, ya que las lineas de flujo convergen. 

Junto a estas dos curvaturas más habituales y utilizadas, existen otras también 
estudiadas en la literatura, si bien con menos aplicación directa por el momento. 
[224] propone un sistema de 12 curvaturas básicas, incluyendo las anteriores: 

■ Curvatura horizontal 

■ Curvatura vertical 

■ Curvatura media 

■ Curvatura máxima 

■ Curvatura mínima 

■ Curvatura de anesfericidad 

■ Diferencia de curvatura 

■ Exceso de curvatura vertical 

■ Exceso de curvatura horizontal 
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■ Curvatura de acumulación 

■ Curvatura total acumulada 

■ Curvatura total anular 

■ Rotor (curvatura de las lineas de flujo) 

A cada uno de estos parámetros puede asignársele una interpretación geomor- 
fométrica, aunque el uso práctico no es frecuente, salvo en el caso de las curvaturas 
horizontal y vertical. 

De igual modo, el estudio de los parámetros geométricos podría continuarse con 
las derivadas de tercer grado, aunque su aplicación práctica aún no se encuentra 
bien definida. Es interesante hacer ver, no obstante, que las derivadas sucesivas son 
más sensibles a los errores del MDE y propagan esta sensibilidad a los resultados 
obtenidos en base a ellas [211]. 

Aunque hemos visto una interpretación de las curvaturas relacionada con los 
flujos de superficie, estas aportan información útil sobre otros aspectos, tales como 
la evolución del suelo, pues esta se encuentra directamente relacionada con el 
comportamiento del agua. También pueden ser útiles, entre otros, para el estudio 
de las comunidades animales, ya que pueden entenderse las zonas cóncavas como 
zonas protegidas y las convexas como zonas expuestas, lo cual tiene una indudable 
repercusión en el desarrollo de dichas comunidades. 

15.5.2. Medidas estadísticas 

Las medidas estadísticas se basan en la aplicación tanto de conceptos estadísti- 
cos básicos como otros más específicos definidos específicamente para su aplicación 
sobre un MDE. Son también en su mayoría elementos derivados de un análisis focal, 
pudiendo en este caso emplear ventanas de análisis de formas y tamaños diversos, 
al no estar condicionados por el uso de ningún modelo matemático del relieve. 

Los parámetros más inmediatos a calcular son los cuatro primeros momentos de 
la distribución de valores en la ventana de análisis, es decir, la media, la desviación 
típica, el coeficiente de asimetría y el de kurtosis. 

La media es un parámetro genérico que se puede utilizar como un operador focal 
sobre cualquier capa de datos, y ya la hemos visto en otros apartados anteriores. 
Tiene, como ya hemos mencionado (14.2.2) un efecto de suavizar la transición entre 
los valores de las celdas, produciendo un desenfoque en el caso de aplicarlo sobre 
imágenes. En el caso del MDT, este suavizado elimina la depresiones compuestas 
por una única celda, aunque ya hemos visto anteriormente que existen métodos 
más elaborados, más idóneos para esta tarea. 

En algunos casos existe una marcada correlación entre un parámetro estadístico 
y uno geométrico de los vistos en el punto anterior. Por ejemplo, la desviación 
típica esta fuertemente correlacionada con la pendiente. 

Otra medida de interés es el rango de valores, esto es, la diferencia entre la 
elevación máxima y la mínima dentro de la ventana de análisis. 
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La combinación de parámetros estadísticos con parámetros geométricos puede 
aportar igualmente información de interés. El calculo de la media aplicada no a 
la elevación sino a parámetros tales como pendiente o curvatura son ejemplos de 
lo anterior. 

Un parámetro más especifico es la rugosidad. Como indica [203] , no existe un 
forma unánimemente aceptada de calcular la rugosidad, ya que los distintos autores 
aportan soluciones muy diversas. El concepto de rugosidad, no obstante, es sencillo: 
expresa lo escarpado del relieve, caracterizando la complejidad de este. Terrenos 
más ondulados o escarpados llevan asociados valores mayores de rugosidad. 

La forma más simple de calcular la rugosidad es empleando la desviación típica 
de las celdas dentro de la ventana de análisis, un parámetro ya comentado. Valores 
altos de este denotan una superficie irregular, mientras que valores bajos indican 
un relieve suave. Este método, no obstante, no se comporta correctamente en todas 
las situaciones, ya que, por ejemplo, asigna un valor alto a una ventana de análisis 
que engloba una superficie suave — lisa — pero en pendiente. Una solución para 
solventar esto es ajustar un plano a los valores de la ventana de análisis y calcular 
la desviación típica de los valores ajustados. 

Un enfoque distinto es el propuesto por [218], incluyendo elementos de cálculo 
vectorial con su factor de rugosidad: 


2 


siendo n el número de celdas en la ventana de análisis y X¿,Y¿ y Z ¿ las componentes 
del vector unitario normal a la superficie en cada una de dichas celdas. Estas 
pueden calcularse a partir de la pendiente y la orientación según las expresiones: 

X¿ = sin(s)-cos(a) (15.5.31) 

Y¿ = sin(s) -sin(a) (15.5.32) 

Zj = cos(s) (15.5.33) 

Acerca de la rugosidad, y puesto que representa la complejidad del relieve, 
debe mencionarse la influencia que tiene en la creación del MDE. Relieves rugosos 
implican una mayor complejidad y son más difíciles de registrar de forma precisa, 
con lo que las exactitud de las técnicas de interpolación al generar un MDE depende 
directamente de la rugosidad del relieve a interpolar. 


(15.5.30) 


R = 


Ki = 1 


Ex, + EY i) + Ez 


i = 1 


n 


i= 1 
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15.6. Análisis hidrológico 

Uno de los fenómenos principales que tiene lugar sobre la superficie terrestre es 
el movimiento de flujos, tanto líquidos como sólidos. El MDE es una herramienta 
de primer orden para un análisis exhaustivo de estos fenómenos hidrológicos. 

Veíamos en el apartado 15.3 cómo resultaba necesario corregir el MDE para 
eliminar las depresiones de origen artificial y así poder asignar direcciones de flujo 
en todas las celdas. Trabajando sobre la base de ese MDE corregido estudiaremos 
a continuación las diversas formas de asignar dichas direcciones y, posteriormente, 
cómo emplearlas para el cálculo de nuevos parámetros. 

La asignación de direcciones de flujo se lleva a cabo mediante un análisis 
de tipo focal, al igual que los parámetros morfométricos que hemos visto hasta 
el momento. Esas direcciones, no obstante, implican una conectividad entre las 
celdas del MDE, y esta conectividad la emplearemos para definir regiones de celdas 
hidrológicamente relacionadas entre sí y realizar un análisis regional. 

15.6.1. Direcciones de flujo 

Las direcciones de flujo definen el comportamiento hidrológico de cada celda 
como unidad aislada. Este comportamiento viene condicionado directamente por 
las celdas circundantes, ya que es la relación entre las alturas de cada una ellas con la 
celda central la que indica la dirección de flujo. Dicha dirección está fundamentada 
en el principio básico y evidente de que el agua en su recorrido se mueve siempre 
hacia el menor potencial posible, esto es, hacia la dirección de máxima pendiente. 

El modelo más sencillo de asignación de direcciones de flujo es el denominado 
D8 [229] , acrónimo derivado de su denominación en lengua inglesa Deterministic 
8. Esta formulación es la implementada en la gran mayoría de SIG con capacidades 
de análisis hidrológico, debido principalmente a su sencillez operativa y facilidad 
de comprensión. 

Los fundamentos teóricos de esta metodología son intuitivos e inmediatos. 
Dada una celda problema, el flujo puede abandonar esta únicamente en ocho 
direcciones posibles, esto es, las ocho que resultan de unir el centro de la celda 
inicial con los de las las ocho circundantes en la ventana de análisis 3 x 3. El ángulo 
de desplazamiento del flujo queda así discretizado en intervalos de 45° (360° / 8) , 
circunstancia que se erige como principal inconveniente del método al restringir 
la variedad de situaciones reales a tan solo 8 posibles. 

El proceso de cálculo de la dirección de flujo es sencillo, y requiere únicamente 
el cálculo de una pendiente media entre la celda central y las 8 circundantes, la 
cual se evalúa mediante la expresión 


Z5~Zi 

7= ‘ 


l 


z= 5 


(15.6.1) 
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donde l representa la distancia entre los centros de las celdas entre las que se 
calcula la pendiente. No se emplea aquí directamente la variable As de tamaño de 
celda, ya que la distancia a aplicar no es igual en las celdas situadas en la vertical o 
en la horizontal de la celda central (l = As), que en las celdas situadas en diagonal 
a la misma (Z = y/2 As) . La dirección de flujo viene definida por la celda que marca 
la mayor de las pendientes. 

La principal ventaja del método, su simplicidad, es también su principal defecto. 
La discretización de las direcciones en múltiplos de 45°hace que flujos que presenten 
rutas ciertamente distintas (con diferencias en orientación tan importantes como 
esos mismos 45°) puedan quedar englobados dentro de un misma dirección, ya que 
la dirección real resulta truncada para encajar dentro de uno de los intervalos. 

La aparición de segmentos rectilíneos paralelos en zonas llanas (Figura 15.10) 
o la acumulación de errores en pendientes monótonas (15.9), son, entre otras, 
algunas de las consecuencias indeseadas de lo anterior. 



Figura 15.9: Propagación de errores de dirección en el modelo D8.La flecha señala la 
dirección real de la pendiente y las celdas sombreadas la dirección de flujo calculada 



Figura 15.10: Líneas paralelas de flujo como resultado de la aplicación del modelo D8 
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Asimismo, existe una imposibilidad para modelizar los procesos de divergencia 
del flujo, al contemplarse tan solo el caso en que este vierte sobre una única 
de sus celdas circundantes. Es decir, que el flujo queda modelizado de forma 
unidimensional, no bidimensional. 

Partiendo de la base conceptual del D8, se han elaborado modelos que tratan 
de superar las deficiencias anteriores y dar lugar a una modelización más realista. 

[230] introduce un elemento estocástico en su modelo Rho8 , manteniendo el 
resto de conceptos del D8. De este modo, aunque no se elimina la discretización 
ni la concepción unidimensional del flujo, se soluciona el problema de las líneas 
de flujo paralelas o la acumulación del error en pendientes uniformes. 

En lugar de calcular la dirección flujo según la máxima pendiente con las celdas 
circundantes, se calcula la orientación de la celda y en función de esta se asigna hacia 
una de las dos celdas que definen una dirección más similar. Por ejemplo, para una 
celda con orientación 15°, la dirección asignada puede ser hacia la celda superior 
(0 o ) o la superior derecha (45°). La asignación de una u otra dirección se produce 
con una probabilidad p establecida en función de la diferencia entre la orientación de 
la celda y la de cada dirección posible. Así, para el ejemplo mencionado, se tendría 


d± = 15— 0 = 15 


í¿2=45 — 15 = 30 (15.6.2) 


15 2 

Pl = 1 -45 = 3 


30 1 

K = 1 -45 = 3 


(15.6.3) 


Aunque mejora al D8, este método presenta el inconveniente de su aleatoriedad, 
y se encuentra raramente implementado. 

Un modelo más elaborado que tiene en cuenta la divergencia de flujo es el FD8 
[231], en el cual el flujo en lugar de verter hacia una única celda, se reparte entre 
las circundantes. La proporción de flujo asignada a cada una de las 8 celdas vecinas 
viene dada por 


_ ( tan.s m ) x 

E?=i(tan S¿ )* 


(15.6.4) 


donde f m es el flujo asignado a la celda m de la ventana de análisis, la pendiente 
hacia la celda i , y x es un factor de convergencia cuyo valor define el comportamien- 
to del algoritmo. A valores más altos de este coeficiente, el flujo resultante es más 
concentrado, resultando una mayor dispersión del mismo para valores bajos. La 
formulación original emplea un valor x = 1, y [232] demuestra que este es un valor 
óptimo, especialmente en terrenos convexos. Autores como [233] recomiendan el 
uso de valores entre 4 y 6, considerando que de este modo se obtiene un adecuado 
equilibrio entre los enfoques anteriormente comentados. 

Por otra parte los valores de las tangentes pueden obtenerse sencillamente 
según lo expresado en 15.6.1. Sólo deben emplearse aquellas tangentes que sean 
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positivas, esto es, que representen ángulos entre la celda central y celdas de inferior 
elevación, pues es exclusivamente hacia estas hacia donde va a desplazarse el flujo. 

[234] propone otra solución similar que pretende por un lado modelizar de forma 
más realista la difusión del flujo, y por otro aportar una formulación más robusta. 
El modelo propuesto sigue basándose en el D8, solventando el problema de la dis- 
cretización de flujo en 8 direcciones únicas, y para indicarlo es bautizado como Doo. 

Se considera la submalla 3x3 como una superficie representada por caras 
triangulares , cada uno de los cuales está definido por la celda central y dos celdas 
consecutivas de su entorno. Se tienen así un total de 8 de estos triángulos, cada 
uno de los cuales define un plano que permite el cálculo de una pendiente asociada. 

Con las pendientes de todos y cada uno de los ocho triángulos, simplemente se 
tomará la mayor de todas ellas y la orientación asociada a dicho triángulo, siendo 
esta la que deberá ser considerada de cara a establecer la dirección de flujo en la 
celda analizada. 

Resta, por último, establecer la difusión entre las dos celdas sobre las que se 
sitúa el triángulo, para lo cual se aplica una sencilla proporción como la siguiente. 

, _ ^ 

r Óa 

b Óa + Ó6 

siendo f a y /j, las proporciones de flujo que deben asignarse a cada celda de las 
anteriores, y (j> a y <t>b l as diferencias angulares entre la orientación y las direcciones 
marcadas por dichas celdas. 

Aunque muy poco habituales, existen asimismo metodologías no basadas en el 
modelo D8, en las cuales el flujo no se desplaza entre los centros de una celda y las 
de su entorno, sino libremente a través de toda la celda sin restringirse a su punto 
central (Figura 15.11). El modelo KRA ( Kinematic Routing Algorithm)[ 235], de 
flujo unidimensional, o el DEMON ( Digital Elevation MOdel Networks ) [236], de 
flujo bidimensional, son ejemplo de ellos. 

Otro autores como [237] proponen modelos que aplican distintas metodologías 
en función de la forma del relieve en cada celda, distinguiendo entre grupos de 
formas orográficas. 

15.6.2. Zonas llanas y depresiones 

Como ya se dijo antes, las zonas llanas y las depresiones representan un pro- 
blema para la asignación de direcciones de flujo. Ahora que ya conocemos los 
algoritmos para llevar a cabo esto último, podemos analizar en profundidad el pro- 
blema que estos elementos representan, y la forma de solucionarlo. Por simplicidad, 
suponemos que utilizamos el algoritmo D8. 


(15.6.5) 
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Figura 15.11: Cálculo de dirección de flujo según Kinematic Routing Algorithm 
(KRA) [235] (trazo fino) y comparación con D8 [229] (trazo grueso) 


Zonas llanas 

Sea la siguiente ventana de análisis: 


60 

60 

60 

60 

60 

60 

60 

60 

60 


Puesto que no existe pendiente entre la celda central y las circundantes, no es po- 
sible asignar una dirección de flujo a la celda central. Incluso en el caso de no utilizar 
el D8, tampoco sería posible, ya que otros algoritmo utilizan principios similares o 
se basan en la orientación, la cual no se encuentra definida para celdas sin pendiente, 
como vimos en 15.5.14. La intuición y la mera observación nos dicen, no obstante, 
que el agua se desplazará a través del relieve definido por la anterior ventana. 

En realidad, puede considerarse que las zonas planas son un artificio dentro de 
un MDE, ya que una zona perfectamente plana no existe en la naturaleza como tal. 
En general, una resolución vertical escasa, bien sea en el almacenamiento o bien 
en la medición de los valores, es la causante de que estas aparezcan en el MDE. 

Supongamos que la anterior ventana se encuentra dentro de un área más amplia 
con los siguiente valores: 


50 

60 

60 

60 

70 

50 

60 

60 

60 

70 

50 

60 

60 

60 

70 


En este caso, resulta fácil intuir que el flujo se desplazará de Este a Oeste, de 
las zonas de mayor elevación a las de menor. El relieve circundante contiene, pues, 
información que puede utilizarse para asignar los valores dentro de la zona llana. 
Existen dos formas de aplicar estas ideas para dar solución al problema: 
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■ Asignar la dirección de flujo en la zona llana en función de las direcciones 
en las zonas circundantes donde los algoritmos correspondientes puedan ser 
aplicados. 

■ Modificar las elevaciones de la zona llana, añadiéndoles una pendiente que 
refleje la tendencia del relieve y la transición entre las zonas circundantes 
de mayor y menor elevación. 

Respecto a la primera, podemos asimilar la dirección de flujo de la celda a la 
tendencia en ese sentido de las celdas que vierten sobre ella. Trabajando sobre la 
metodología del D8 para ello, y entendiendo cada dirección de flujo como un vector 
que une el centro de la celda origen con el de aquella sobre la que vierte su flujo, 
una simple suma vectorial de los vectores que representan dichos flujos dará lugar 
a un nuevo vector, el cual puede utilizarse como dirección de flujo (Figura 15.12). 




1 



— 

— 







Figura 15.12: Cálculo de dirección de flujo sobre una celda llana (en trazo grueso) como 
suma vectorial de las direcciones de las celdas que vierten sobre la misma (en trazo fino). 

Si alguna de las celdas situadas alrededor de la celda problema es a su vez 
plana, al evaluar la dirección de flujo de esta será necesario recurrir también al 
algoritmo anterior, continuándose así sucesivamente hasta alcanzar una zona no 
llana. En ese momento, quedarán definidas todas las direcciones anteriores hasta 
llegar a dicho emplazamiento desde la celda problema original. 

Aunque solucionando eficientemente la dificultad de las zonas planas, esta 
metodología adolece de algunos problemas de precisión, permitiendo la evalua- 
ción de una dirección de flujo en zonas planas pero arrojando en determinadas 
ocasiones resultados con ciertas deficiencias, especialmente para zonas planas de 
gran extensión. La posibilidad de existencia de más de un punto de salida o la 
indeterminación en ciertos casos de la dirección a asignar por existir varias opciones 
válidas implica la introducción de elementos arbitrarios que conllevan una serie 
de aspectos negativos. El problema de las líneas paralelas de flujo es en este caso 
uno de los principales defectos que pueden asociarse con esta metodología. 

[238] propone una filosofía opuesta empleando las celdas hacia las que vierte la 
zona llana y que tengan por sí mismas un flujo bien definido. Con ellas, aplicando 
un proceso iterativo similar al anterior, se define el flujo de las celdas circundantes 
a las mismas encaminándolo hacia ellas y continuando de este modo hacia las 
restantes celdas hasta completar la totalidad de la zona llana (Figura 15.13). No 
obstante, la similitud en cuanto a sus conceptos, aunque con algunas diferencias, 
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hace que puedan asociarse a esta alternativa unas desventajas similares a las 
comentadas en el método anterior. 


2 

2 

2 

2 

2 

2 

1 

1 

1 

2 

2 

1 

1 

1 

2 

2 

1 

1 

1 

2 

2 

2 

2 

0 

2 



















X 

1 





0 









I 





X 






x 






0 














X 

1 





X 






0 



Figura 15.13: Cálculo de direcciones de flujo sobre zonas llanas según [238]. La malla 
de la izquierda representa las alturas del MDE, donde se aprecia la zona llana de elevación 
1 (en gris) . Las mallas sucesivas presentan las etapas del proceso iterativo de asignación 
de direcciones de flujo a partir del punto de salida existente. 

El segundo planteamiento, la modificación del MDE para darle una cierta 
pendiente sobre las zonas llanas, es más adecuado, puesto que da como resultado 
un MDE hidrológicamente correcto sobre el que pueden aplicarse sin problemas las 
formulaciones habituales. [239] propone establecer dicha modificación aplicando 
los conceptos de las dos soluciones anteriores. Es decir, considerando que el flujo 
sigue la dirección marcada por las celdas aguas arriba, alejándose de las zonas 
altas, y confluyendo hacia la dirección señalada por las celdas aguas abajo. 

Para ello, define dos capas de elevaciones modificadas, una reflejando cada uno 
de los fenómenos anteriores (alejamiento de las zonas altas y direccionamiento 
hacia las zonas bajas), la suma de las cuales da lugar al MDE modificado sin zonas 
llanas (Figura 15.14). 

Depresiones 

Sea la siguiente ventana de análisis: 
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Nos encontramos con un problema similar al anterior, ya que todas las pendien- 
tes desde la celda central son positivas, y no existe ninguna dirección de flujo que 
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Figura 15.14: Modificación del MDE para el cálculo de direcciones de flujo sobre zonas 
llanas según [239] . De izquierda a derecha y de arriba a abajo: elevaciones originales, modifi- 
cación de elevaciones según los dos supuestos considerados y elevaciones finales resultantes. 


represente un movimiento hacia aguas abajo. En la realidad, no obstante, una depre- 
sión como la anterior no hace que el agua detenga su movimiento. El flujo rellenará 
la depresión y verterá por la celda de menor elevación, continuando su camino. 

Una depresión no siempre lleva implícita la imposibilidad de asignar una 
dirección de flujo a todas sus celdas. Sea el siguiente fragmento de un MDE. 
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En este caso, de las dos celdas de la depresión, solo una de ellas no tiene direc- 
ción de flujo (de elevación 57), pero en la otra (de elevación 58) esta es incorrecta, 
puesto que vierte sobre la primera y la tendencia natural del terreno es la contraria. 
El proceso que tiene lugar será bien distinto, ya que el flujo rellenará la depresión 
y saldrá de esta desde la celda de elevación 58 y hacia la de menor elevación de 
su entorno, en este caso 59. 

Las depresiones, especialmente las que están formadas por un número pequeño 
de celdas o incluso una sola celda, son en general producto de los procesos de 
interpolación que tienen lugar para la creación del MDE. No obstante, puede deberse 
a otras razones. Distinguimos según esto los siguientes tipos de depresiones [103]. 

■ Depresiones artificiales debidas a los procesos de creación del MDT 

■ Depresiones naturales que deben ser eliminadas, tales como lagos o embalses, 
ya que en realidad estas depresiones se encuentran llenas y se produce un 
flujo sobre ellas. 
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■ Depresiones naturales que no deben ser eliminadas, tales como las las exis- 
tentes en zonas kársticas, que suponen efectivamente un impedimento para 
el flujo. 

El procesado del MDE debe trabajar con los dos primeros casos, ya que, inde- 
pendientemente de su origen, es necesario eliminar las depresiones que, al aplicar 
sobre ellas los algoritmos de flujo, no dan resultados acorde con el proceso real 
que tiene lugar. 

Una primera forma de eliminar las depresiones es mediante el empleo de filtros 
[240]. Esta metodología, no obstante, no soluciona el problema cuando las depre- 
siones son de varias celdas, y además modifica la totalidad del MDE, incluyendo 
las celdas correctas que no forman parte de las depresiones. 

Las metodologías más elaboradas tratan de simular el verdadero comporta- 
miento del agua, que llena la depresión hasta una altura fija igual en todas las 
celdas, y vierte así fuera de esta. Autores como [240] suponen que la presencia de 
una depresión es debida a un error en los valores de elevación, siendo este error 
siempre por defecto. Es necesario en este caso, por tanto, elevar dichos valores. 

Otros como [241] adoptan el enfoque anterior, pero añaden al mismo una posibi- 
lidad totalmente opuesta, esto es, que la depresión sea debida a una estimación exce- 
siva de la altura de una celda. Esto provoca que dicha celda (o celdas) actúen a modo 
de dique, obstruyendo el desplazamiento del flujo a lo largo de las celdas erróneas. La 
solución en este caso contempla de igual modo la disminución de la cota en aquellas 
celdas donde se presenten estas características, «abriendo» caminos para el flujo. 

Al aplicar alguno de los algoritmos anteriores, obtenemos sobre la depresión 
una zona plana de cota fija, suficiente para que el flujo pueda conducirse fuera de 
esta con los algoritmos habituales. El MDE resultante puede modificarse nueva- 
mente aplicando los algoritmos ya explicados para la eliminación de zonas llanas, 
obteniéndose así un nuevo MDE ya hidrológicamente correcto. 

La figura 15.15 presenta un esquema comparativo de los diferentes resultados 
que se obtienen mediante la aplicación de un simple llenado y de la consideración 
conjunta de llenado y apertura. 

[242] propone una solución con un planteamiento radicalmente opuesto. En 
este caso el algoritmo trabaja «inundando» la totalidad el MDT — elevando la 
cota de todo él como si hubiera un exceso de agua a lo largo de toda su extensión — 
y posteriormente retirando dicha capa de agua a excepción de en las depresiones, 
donde esta se queda y las llena, eliminándolas así. 

La figura (15.16) muestra un sencillo esquema del funcionamiento de esta 
formulación. 

15.6.3. Área acumulada y parámetros derivados 

El área acumulada es el parámetro principal que puede obtenerse de la aplicación 
de los algoritmos de direcciones de flujo. Las direcciones de flujo como parámetro 
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Figura 15.15: De derecha a izquierda, elevaciones originales, eliminación de la depresión 
usando llenado y eliminación de la depresión mediante llenado y modificación de celdas 
obstáculo. En negro, celda de desagüe. En gris, celdas modificadas. 



Figura 15.16: Eliminación de depresiones según [242], 


focal establecen relaciones entre las celdas y sus vecinas inmediatas. El área 
acumulada utiliza estas relaciones, pero no en el entorno reducido de la ventana de 
análisis, sino con carácter zonal, estudiando el conjunto de celdas hidrológicamente 
conectadas con una dada. En particular, conectadas y situadas aguas arriba de ella. 

Para una celda cualquiera, su flujo va a desplazarse por efecto de la gravedad a 
una o varias (en función del método empleado) de sus celdas vecinas. Estas celdas 
que reciben el flujo lo desplazaran a su vez a las inferiores, y así sucesivamente. 
El área acumulada de una celda particular representa el área total de aquellas 
celdas cuyos flujos, siguiendo este mecanismo, acabaran pasando por dicha celda 
problema. En el caso del D8, se considera que todo el área de la celda es aportada 
a la celda inferior. En los métodos de flujo bidimensional, como vimos, solo una 
fracción es aportada a cada una de las inferiores. 

El D8 es, por su simplicidad, el más didáctico de los métodos, y permite 
comprender visualmente el concepto de este parámetro (Figura 15.17). 

La diferencia entre los métodos de asignación de direcciones de flujo se ve 
de forma gráfica al calcular el área acumulada empleando cada uno de ellos. La 
figura 15.18 muestra los valores de área acumulada para una superficie generada 
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Figura 15.17: El área acumulada de una celda dada (en rojo) es la suma de las áreas 
de las celdas conectadas con esta y situadas aguas arriba (en azul) . Los trazos indican 
la conectividad entre celdas según el modelo D8 


artificialmente con forma de cono, calculados estos con cada uno de los métodos 
explicados en 15.6.1. 
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Figura 15.18: Representación del área acumulada sobre un cono circular según los 
principales algoritmos de asignación de direcciones de flujo (adaptado de [243]) 

En la figura 15.19 puede verse el mapa de área acumulada para la región del 
juego de datos de ejemplo. Como se dijo en 14.2.1, el uso de una transformación 
logarítmica enriquece la representación resultante. 

Puede aplicarse una ponderación a las celdas, de tal forma que los valores 
resultantes no expresen un área, sino otra variable distinta. Por ejemplo, puede 
considerarse un valor de escorrentía para cada celda, de tal modo que se obtendría 
una escorrentía acumulada. 









394 


Sistemas de Información Geográfica 



Figura 15.19: Mapa de área acumulada. Se ha utilizado una representación logarítmica 
para aumentar la información visual proporcionada la imagen) 


De igual modo, pueden emplearse algunos de los parámetros que hemos desa- 
rrollado anteriormente y calcular después valores medios. Un posible ejemplo 
es la pendiente media aguas arriba. Esta se calcula con un mapa de pendiente 
acumulada — ponderando las celdas según su pendiente — , y dividiéndolo por el 
mapa de área acumulada, expresada esta en numero de celdas. Puesto que refleja la 
pendiente media de las celdas que aportan flujo, este parámetro puede relacionarse 
con la velocidad y energía de dichos flujos. 

Empleando un enfoque similar basado en el estudio de direcciones de flujo y 
conectividad hidrológica entre celdas, se obtienen otros parámetros tales como 
la longitud de flujo desde aguas arriba. Este valor refleja la distancia máxima 
recorrida desde cada celda hasta el punto hidrológicamente más alejado de entre los 
situados aguas arriba de ella. El concepto de orden jerárquico de cauces [244, 245] 
puede aplicarse a la densa red que conforman todas las conexiones entre celdas, 
para obtener una nueva capa de ordenes (Figura 15.20). 

Un concepto importante a la hora de calcular el área acumulada u otros pará- 
metros derivados como los anteriores es el de contaminación de borde. Se dice que 
una celda está afectada por contaminación de borde cuando entre aquellas celdas 
que se encuentran situadas aguas arriba de esta se incluyen celdas en el borde el 
MDE. Puede suceder que estas celdas de borde tengan aguas arriba de ellas otras 
celdas, pero, puesto que estas no se encuentran en el MDE, no podemos conocerlas. 
De esta forma, el valor de área acumulada que se obtiene para las celdas afectadas 
de contaminación de borde es probable que no sea correcto. 

Si tenemos un MDE de la parte baja del cauce, podemos calcular sin problemas 
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Figura 15.20: Mapa de órdenes de Strahler. 


todos los parámetros morfométricos tales como pendiente, orientación, etc. Sin 
embargo, los parámetros hidrológicos no serán correctos, ya que estamos ignorando 
los tramos medio y alto del cauce, sin duda con influencia en el tramo bajo que 
analizamos. 

La figura 15.21 muestra la porción del MDE de ejemplo que ofrece datos validos 
de área acumulada y otros parámetros hidrológicos. La cuenca vertiente a las 
celdas mostradas no alcanza los bordes del MDE, garantizando así que se encuentra 
contenida íntegramente dentro de este. 

Por último, citar el concepto de área aportante específica, que se emplea para 
el cálculo de índices y otros parámetros derivados. Este área específica se obtiene 
dividiendo el área entre la anchura de la sección considerada (a' = a/ w), siendo 
esta el ancho de celda. 

15.6.4. Extracción de redes de drenaje 

La extracción de redes de drenaje es una de las tareas principales del análisis 
hidrológico. El objetivo de este proceso es definir, de entre las celdas del MDE, cuáles 
forman parte de los cauces y cuáles no. En aquellas que forman parte de los cauces, se 
asume que existe por tanto un flujo encauzado. En las restantes, el flujo es en ladera. 

Para llevar a cabo este análisis se utiliza el propio MDE y una capa de informa- 
ción adicional, sobre la cual se establece una condición que permite el trazado de 
los cauces. El procedimiento para llevar esto a cabo implica los siguientes pasos: 

■ Selección de celdas de cabecera, en las cuales se da el inicio de los cauces. 

■ Delineación de los cauces analizando las celdas aguas abajo de las de cabecera. 
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Figura 15.21: MDE tras aplicar una máscara basada en contaminación de borde. Las celdas 
con valores son las únicas para las que puede calcularse el área acumulada de forma fiable. 


Las celdas de cabecera son aquellas para cuales se cumple la condición de 
existencia de cauce, no cumpliéndose para ninguna de las circundantes situadas 
aguas arriba. 

Respecto a la delincación de los cauces hacia aguas abajo, a pesar de la existencia 
de otros métodos que hemos ya argumentado como más adecuados para las tareas 
hasta ahora vistas, se utiliza por regla general el método D8. Con él, se señalan las 
celdas situadas aguas abajo de las de cabecera, y por la naturaleza del modelo, que 
supone un flujo unidimensional, los cauces resultantes tiene un ancho de una celda. 

Aunque esta forma de proceder es sencilla, presenta una gran numero de 
posibles soluciones, surgiendo dos cuestiones iniciales: qué capa de información 
adicional debe utilizarse y qué condición establecer sobre ella. 

Como capa de apoyo debemos emplear cualquiera que pueda aportar informa- 
ción relevante sobre la presencia de cauces. El proceso de formación de un cauce 
depende de numerosos factores tales como la precipitación, o las características 
del suelo y la litología, pero en última instancia es el relieve quien condiciona la 
definición de la red de drenaje. Por tanto, es lógico que la capa de información 
adicional sea una de las derivadas del MDE. 

La opción más habitual es emplear el área acumulada como parámetro de apoyo. 
Zonas con altos valores de la misma implicarán a su vez zonas a las que llega un volu- 
men de escorrentía mayor, ya que este se genera en una superficie mayor aguas arriba. 
Este mayor volumen hace más probable que el flujo se defina en esas celdas un cauce. 

Si valores elevados son los que marcan la existencia de celdas de cauce, la 
condición a imponer consistirá en establecer un umbral y ver qué celdas lo superan. 
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Aquellas que lo superen y cumplan los requisitos para ser celdas de cabecera, serán 
utilizadas para delinear los cauce hacia aguas abajo de estas. 

Aunque sabemos que la condición es de tipo mayor que , resta por establecer 
un valor concreto para el umbral. Del valor escogido depende directamente la red 
de drenaje resultante. Un umbral mayor hará que existan menos celdas que lo 
superen, y las cabeceras se situarán en puntos más bajos. La red resultante será 
menos densa. Por el contrario, si el umbral es menor, las cabeceras se situarán en 
celdas más elevadas y la red sera más densa y ramificada. 

La elección de un umbral debe realizarse de tal modo que la red de drenaje 
coincida en la mayor medida posible con la realidad fisiográfica, tanto en la coin- 
cidencia de las cabeceras con los puntos reales de nacimiento de los cauces como 
en el numero de estos. 

La figura 15.22 muestra dos capas con redes de drenaje extraídas aplicando 
distintos valores de umbral. 





Figura 15.22: Redes de drenaje extraídas para umbrales de area acumulada de lOha 
(a), lha (b) y 0,lha (c) 
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La estimación de un valor óptimo de umbral de forma automatizada es difícil, 
aunque existen formulaciones al respecto. Quizás la más elaborada de ellas es la 
desarrollada por [246], quien, fundamentándose en la constancia de las diferencias 
altitudinales entre los extremos de tramos de un mismo orden [247] , propone una 
aproximación estadística a este cálculo. 

Aunque es con mucha diferencia la opción más habitual, la utilización del área 
acumulada como parámetro de apoyo no es en absoluto ideal. Su utilización implica 
la generación de redes con densidad de drenaje constante, algo que realmente no 
sucede en la naturaleza, siendo esta mayor en los tramos altos que en los medios 
y bajos de los cauces. 

[248] propone sustituir el área acumulada por un parámetro de la forma 

A' = a's a (15.6.6) 

donde a' es el área aportante específica, s la pendiente en la celda y a un factor 
que debe determinarse empíricamente, proponiendo el autor para las zonas por 
él estudiadas un valor de a = 2. 

[249] propone el uso de la malla de valores de órdenes jerárquicos de Strahler, de 
tal modo que el establecimiento de un umbral se asemeja a «podar» la estructura 
arbórea de la red que conforman todas las conexiones entre celdas hidrológicamente 
relacionadas, hasta reducirla a los tramos de orden superior que forman la red de 
drenaje real. 

Por último, [250] propone utilizar el área acumulada, pero de tal forma que esta 
refleje solo las celdas aguas arriba que cumplan una condición dada. En particular, 
se considera que las celdas que tienen una influencia que debe ser considerada sobre 
el establecimiento o no de cauces y la presencia de fenómenos de flujo encauzado 
son aquellas de tipo cóncavo, entendiéndose que estas son las que concentran el 
flujo de agua. 

La localización de estas celdas, en lugar de con la aplicación de los conceptos 
de curvatura vistos en su momento, se lleva a cabo mediante un algoritmo [251] 
basado en una matriz 2x2 que se desplaza a lo largo de todas las celdas de la malla. 
En cada punto, de las 4 celdas que componen dicha matriz se señala sobre una 
nueva malla la celda de mayor elevación. Una vez que se ha desplazado la submalla 
2 x 2 a lo largo del todo el MDE, las celdas que no han sido señaladas representan 
las celdas de valle cuya influencia debe ser considerada. 

La figura 15.23 muestra gráficamente la aplicación del algoritmo de localización 
de celdas cóncavas. 

Con respecto a la extracción de redes de drenaje, existe una preparación del 
MDE que puede mejorar esta si se dispone de información adicional. Al contrario 
que la eliminación de zonas llanas y depresiones, no se trata de una preparación 
necesaria, sino simplemente de configurar el MDE antes de su análisis para reflejar 
esa información adicional. 
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Figura 15.23: Identificación de celdas de valle según [251]. En cada pasada se señala la 
celda más elevada de cada cuatro. Las celdas no señaladas al final del proceso constituyen 
las celdas de valle. 


Si se dispone de una red de drenaje (por ejemplo, obtenida por digitalización de 
cartografía clásica de la red fluvial) , podemos modificar el MDE para que la red de 
drenaje que posteriormente extraigamos de él coincida con esa red que conocemos 
a priori. Este encauzamiento forzado se efectúa a través de la modificación de las 
cotas de las celdas implicadas. 

Las celdas a modificar son, en el caso más habitual, aquellas sobre las que se 
sitúan los cauces que conocemos de antemano. La elevación de estas debe reducirse 
en un valor fijo h que haga que las celdas adyacentes viertan obligatoriamente 
sobre ellas. Este proceso se conoce habitualmente como river burning 1 

[252] propone una solución más compleja en la que las celdas de cauce se mo- 
difican todas ellas en un valor fijo, y aquellas situadas de las celdas de cauce a una 
distancia menor que un determinado umbral establecido se modifican igualmente, 
pero este caso en función de dicha distancia. De esta forma, la transición entre 
las celdas de cauce forzadas y las circundantes se produce de forma suave. 


15.6.5. Delimitación y caracterización de cuencas vertientes 

Juntos a los cauces, las cuencas vertientes son los otros objetos geográficos con 
significado hidrológico que pueden extraerse del análisis del MDE. Dada una celda 
de salida, su cuenca vertiente estará compuesta por todas las celdas aguas arriba 
de la misma. Estas celdas son las que, sumando su superficie total, nos daban el 
valor de área acumulada. En este caso, no obstante, el resultado del análisis no 
es el valor de dicho área, sino el espacio geográfico concreto que ocupa. Además de 
ésto, para las celdas interiores a la cuenca pueden calcularse valores relacionados 

1 Literalmente, quemar los ríos sobre el MDE, ya que es como si su forma fuera marcada a 
fuego sobre este. 
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con la propia estructura de la cuenca, así como otros que pueden utilizarse para 
caracterizar esta y realizar un análisis hidrológico más exhaustivo. 

Delimitación. Cuencas y subcuencas 

Con el conocimiento de las direcciones de flujo y las conexiones entre celdas, el 
procedimiento para delinear una cuenca vertiente no difiere mucho del cálculo del 
área acumulada para una celda. Al igual que sucedía en la extracción de cauces, 
lo general es aplicar el método D8, ya que da lugar a cuencas bien definidas, que 
pueden representarse mediante capas ráster con dos únicos valores, uno para las 
celdas que pertenecen a la cuenca vertiente y otro para las que no. Si se aplica otra 
metodología tal como Doo o FD8, al dividirse el flujo entre las celdas circundantes, 
pueden existir celdas que aporten su flujo a la cuenca pero no de forma completa, 
con lo que su pertenencia a la misma no lo es en el mismo grado que las restantes. 
La figura 15.24 muestra gráficamente la diferencia entre las cuencas obtenidas 
utilizando los métodos D8 y FD8 respectivamente. 



a) b) 


Figura 15.24: Comparación entre una cuenca calculada mediante el método FD8 (a) 
y otra aplicando el método D8 (b). Las celdas en color gris solo aportan parte de su flujo 
a la unidad hidrológica. El punto rojo señala el punto de cierre. 

Nótese que, aunque ambas cuencas sufren el efecto de la contaminación de 
borde, la calculada por el método FD8 lo hace en mayor medida. Es decir, el 
algoritmo de flujo puede condicionar la extensión de la cuenca vertiente y con ello 
efectos tales como el de contaminación de borde. 

Por medio de un análisis similar al anterior podemos no solo calcular la cuenca 
a un punto dado, sino sub dividir esta en subunidades hidrológicas menores. El 
conjunto de estas subunidades conforma una teselación del espacio ocupado por 
la cuenca en subcuencas independientes. 

Existen dos formas principales de subdividir una cuenca, requiriéndose infor- 
mación adicional además de la localización de la celda de salida: 

■ Mediante celdas de salida adicionales correspondientes a cada subcuenca 

■ Mediante un umbral de tamaño máximo de las subcuencas. 
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Para el primer caso, se calculan las cuencas vertientes a todos las celdas de 
salida especificadas, considerándose siempre que la cuenca asociada a las celdas 
situadas aguas abajo engloba a la de aquellas situadas aguas arriba de ella, y 
descontando la superficie de intersección. Los puntos de salida generalmente se 
establecen sobre las celdas que representan confluencias de cauces donde el orden 
jerárquico de la red de drenaje varía. Este es un ejemplo directo de aplicación de 
la red de drenaje que extrajimos en el punto anterior. 

Si asignamos ordenes jerárquicos de Shreve [253] , tendremos una subcuenca 
para cada subtramo, ya que estos ordenes varían en cada confluencia. Si, por el 
contrario, empleamos ordenes de Strahler [245], solo serán consideradas como 
celdas de salida aquella confluencias en las que se unan cauces de igual orden. La 
figura 15.25 muestra un ejemplo de la primera de estas variantes. 



Figura 15.25: División de una cuenca en subcuencas con puntos de salida en confluencias 
con variación de órdenes de cauce 

El otro método de subdivisión no requiere el empleo de otras celdas de salida 
además de la correspondiente a la cuenca global. Las subcuencas se establecen de 
tal modo que todas ellas tienen un superficie similar, la cual condiciona el número 
de estas que aparecen. 

Caracterización 

La información sobre la superficie y forma de la cuenca, así como la de los 
valores interiores de la misma y las relaciones hidrológicas entre sus celdas, son 
la base para elementos de caracterización de la cuenca vertiente. 

En primer lugar, tenemos el área y perímetro de la cuenca, parámetros clásicos 
sencillos de calcular sobre la capa que define la cuenca, bien contando las celdas o 
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las celdas de borde. El centro de masas del conjunto de celdas es el centro de masas 
de la cuenca, de interés para el cálculo de parámetros accesorios con significado 
hidrológico. 

Como ya vimos en 14.2.4, la capa con la cuenca puede usarse como máscara 
para limitar las celdas con valores válidos de una determinada variable a aquellas 
dentro de la cuenca. Haciendo esto, el histograma de frecuencia de estos valores 
o una curva hipsográfica calculada con ellos sirve como descriptor de la cuenca. 

Un parámetro de interés es la distancia de flujo desde cada celda hasta el 
punto de salida. Suponiendo una velocidad media en las celdas de la cuenca, estas 
distancias pueden convertirse en tiempos de salida. La estimación de la velocidad 
constante puede hacerse, por ejemplo, utilizando el tiempo de concentración de 
la cuenca. El histograma de frecuencias de estos puede emplearse para obtener 
un hidrograma unitario de la cuenca (Figura 15.26). 



a) b) 


Figura 15.26: a) Mapa de tiempos de salida suponiendo velocidad constante, b) 
Histograma de frecuencias asociado. 

El cálculo puede hacerse de forma más precisa si se suponen distintas veloci- 
dades en los cauces y fuera de ellos. [254] propone una relación de la forma 

Vi adem = ^Y^ (15.6.7) 

donde k se sitúa según el autor en el intervalo de valores 10-15. 

Se puede plantear un modelo más detallado si se consideran las condiciones 
particulares de cada celda (pendiente, área acumulada, rugosidad hidráulica, etc.), 
y se asigna una velocidad individual a cada uno en función de ellos. En [255] puede 
encontrarse un modelo de estas características en el cual las celdas se dividen en 
tres grupos en función de su área acumulada, aplicándose formulaciones distintas 
para cada uno de ellos. 
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15.6.6. índices hidrológicos 

Con todos los parámetros, tanto hidrológicos como morfométricos, que hemos 
visto hasta el momento, disponemos de una gran cantidad de información acerca 
del relieve. Combinando estos se pueden crear nuevos índices hidrológicos que 
caractericen de forma más precisa el comportamiento hidrológico de cada celda. 
Tres son los principales índices. 

■ índice topográfico de humedad 

■ índice de potencia de cauce 

■ Factor topográfico LS 

Todos ellos se basan en la pendiente y en el área acumulada específica como 
parámetros básicos 

El índice topográfico de humedad [256] se define como 

1 = ln— (15.6.8) 

tans 

donde a' es el área acumulada específica y s la pendiente. 

Es habitual sustituir la pendiente nula por una de valor muy pequeño, del orden 
de 0,0001% por ejemplo, para evitar que el índice no quede definido en celdas planas. 

Detrás de su aspecto sencillo, este índice esconde una gran cantidad de infor- 
mación. Originalmente fue definido con objeto de expresar la relación entre la 
morfología del relieve y la acumulación de agua en el suelo, responsable esta a 
su vez de la escorrentía generada, velocidad de flujo, etc. En particular, un uso 
principal de este índice es el relacionado con la producción de escorrentía bajo 
el supuesto de que esta se produce en presencia de una saturación de agua en el 
suelo, momento en el que nivel freático alcanza la superficie. 

Valores altos del índice implican zonas con baja pendiente o con gran cantidad 
de área acumulada. Por tanto, se trata de celdas a las que llegarán flujos abun- 
dantes y que no evacúan bien dicho flujo, teniendo tendencia a acumular humedad. 
Por el contrario, las celdas con valores bajos, con elevada pendiente y baja área 
acumulada, serán celdas en las que no se encontrará humedad edáfica. 

La figura 15.27 muestra el mapa de este parámetro. 

De formulación similar el anterior, el índice de potencia de cauce caracteriza 
la energía de los flujos a través de cada celda. Su expresión es la siguiente: 

P=a's (15.6.9) 

Valores altos tanto de área acumulada como de pendiente, ambos implican 
una mayor energía del flujo. En un caso, porque este flujo sera abundante, y en 
otro porque llevará una mayor velocidad. 

Por último, el factor LS de la Ecuación Universal de Pérdidas de Suelo, ori- 
ginalmente basado en la longitud de la pendiente y su magnitud, se sustituye por 
la siguiente expresión [257], empleando el área acumulada específica: 
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Figura 15.27: Mapa de índice topográfico de humedad. 


LS = 



m 


sin/3 \ n 
0,0896 ) 


(15.6.10) 


donde m y n son parámetros a establecer empíricamente, para los cuales [257] 
demuestran que, con laderas menores de 100 metros de longitud y pendientes 
hasta 14°los valores m = 0,6 y n= 1,4 dan resultados ajustados a las formulaciones 
originales. Por su parte, [258] propone unos valores de m = n=l para el caso en 
que la erosión predominante sea de tipo laminar, o bien m = 1,6 y n = 1,3 en caso 
de que exista predominio de erosión en regueros. 

El hecho de emplear área acumulada en lugar de la longitud de pendiente hace 
que se tengan en cuenta factores como la convergencia de flujo, no contemplados 
en la formulación original. 


15.7. Visibilidad 

Las formas del relieve condicionan la visibilidad entre puntos del MDE, pu- 
diendo bloquear la línea de visión entre ellos. Un análisis de visibilidad permite 
saber si dos celdas tienen conexión visual o conocer qué otras celdas son visibles 
desde una celda dada. Puesto que el concepto de visibilidad es recíproco, esto es 
equivalente a calcular qué otras celdas ven a una celda dada. 

El conjunto de celdas relacionadas visualmente con una concreta conforman 
la cuenca visual asociada a esta. El cálculo de la cuenca visual implica el estudio 
de todas las direcciones en las que la luz llega a (o parte de) la celda, analizando 
para cada una de ellas una linea de visión. 


Geomorfometría y análisis del terreno 


405 


Cada línea de visión pasa por una serie de celdas, las cuales serán visibles o 
no en función de las formas del relieve que se interpongan entre estas y la celda 
central que define la cuenca visual. Para calcular si cada una de estas celdas A es 
visible desde la central B, calculamos el ángulo de la línea que las une, según 

a = arctan (^^ — ~ ^ (15.7.1) 

siendo cIab la distancia entre A y B. Si el ángulo formado por cualquier otra 
celda, B ' , más próxima a A que B es mayor, entonces B no es visible desde A. El 
procedimiento puede ilustrarse con un pequeño ejemplo numérico como el siguiente. 


10 

16 

23 

16 

9 

6 

14 

11 

18 

11 

18 

19 

19 

15 

13 

21 

23 

25 

20 

20 

19 

14 

38 

45 

24 

20 

20 

28 

18 

49 

23 

24 

34 

38 

45 

51 


Figura 15.28: Una pequeña capa ráster de ejemplo 

Sobre la capa ráster de la figura 15.28, definimos una linea de visión entre las 
celdas superior e inferior de la columna izquierda. Si suponemos un tamaño de 
celda igual a 1 , los valores de los ángulos y si son visibles o no desde la primera 
celda (la de la esquina superior izquierda) se presentan en la tabla 15.7. 


Fila, col. 

H 

AH 

AH/Dist. 

Visible sí/no 

1,2 

14 

4 

4 

Visible 

1,3 

19 

9 

4.5 

Visible 

1,4 

22 

12 

4 

No visible 

1,5 

24 

14 

3.5 

No visible 

1,6 

23 

13 

2.6 

No visible 


Cuadro 15.1: Análisis de visibilidad sobre una linea de visión. 


Aunque existen similitudes entre el concepto de una cuenca hidrológica y 
una cuenca visual, esta última no ha de estar necesariamente formada por un 
único polígono, sino que puede componerse de varios polígonos aislados entre sí. 
Igualmente, no existe una relación entre las celdas de la cuenca (no han de verse entre 
sí) , al contrario de lo que ocurre en la cuenca hidrológica donde sí se da esta relación. 
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En el cálculo de visibilidades, ha de incorporarse asimismo el significado físico 
del fenómeno analizado. Dos puntos a una distancia de muchos kilómetros, si no 
existe relieve entre ellos, resultarán como visibles entre si efectuamos un análisis 
como el descrito. No obstante, por las propias limitaciones de la visión humana, 
así como por efectos atmosféricos y otros factores, no es lógico pensar que tales 
puntos puedan verse. El análisis visual debe, por tanto, limitarse a una distancia 
acorde con el proceso modelizado. 

En la figura 15.29 puede verse la cuenca visual asociada a una celda concreta. 



Figura 15.29: Cuenca visual asociada a un punto dado (en rojo). Se ha supuesto una 
altura del objeto de 20 metros. 


El uso de cuencas visuales es habitual, por ejemplo, para el emplazamiento 
de antenas de telefonía o radio. Puesto que la intensidad de la señal decrece con la 
distancia, también en este caso deben delimitarse las cuencas visuales (que en este 
caso señalarían aquellas celdas que reciben y pueden utilizar la señal de la antena) 
no en base únicamente a los elementos del relieve, sino también a la distancia. 

Partiendo de este razonamiento, podemos extender el concepto de visibilidad, y 
generar capas con más información. En lugar de generar una nueva capa donde las 
celdas tengan únicamente dos posibles valores — visible o no visible — , puede asig- 
narse a las celdas visibles valores tales como la distancia al emisor, el ángulo entre 
emisor y receptor, o el tamaño relativo con que se visualiza el punto. Este último aná- 
lisis es de utilidad, por ejemplo, para el emplazamiento de elementos constructivos 
con una altura dada h. tales como aerogeneradores, y evaluar así el impacto visual 
que producen. Se calcula no solo el número de celdas que ven el elemento — la canti- 
dad de celdas afectadas — , sino cómo ven a ese elemento — cómo es esa afección — . 
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Para calcular el tamaño relativo de un objeto dimensión h visto desde una 
celda concreta, se utiliza la expresión 

TAM =arctan(^— (15.7.2) 
V«AB/ 

siendo ¿ab la distancia entre la celda donde reside el objeto y la celda del observador. 

Esta altura que se añade a las celdas donde emplazamos un objeto, en realidad 
también puede añadirse a las restantes, ya que el observador también tiene una 
altura dada. En general, no obstante, tiende a no utilizarse esta. Nótese que añadir 
una altura a un objeto cambia en cierta medida el concepto de visibilidad, ya que, 
según el caso analizado, implicara ver el objeto en su totalidad, y no solo la parte 
superior que marca la altura máxima. 

Hasta este punto, hemos utilizado el concepto de visibilidad para un único 
punto, pero podemos repetir el análisis para todas las celdas o para un conjunto 
de ellas. Este procedimiento permite calcular otros parámetros, tales como el 
numero de celdas que se ven desde cada una, pudiendo incluso ponderar estas para 
adjudicar un significado más concreto a estos valores. Por ejemplo, si ponderamos 
las celdas en función de su valor paisajístico, el numero de celdas vistas sera un 
indicador de la belleza escénica de la misma. 

El resultado de este análisis de visibilidad repetido se conoce como exposición 
visual [217]. La figura 15.30, muestra el numero de celdas de cauce vistas desde 
las restantes, sirviendo así para evaluar en cierto modo la belleza paisajística que 
deriva de la presencia del cauce. Estas celdas a su vez se han ponderado en función 
de la importancia del cauce. 



Figura 15.30: Mapa de exposición visual de un cauce, reflejando el número de celdas 
pertenecientes a este que son visibles desde cada una de las restantes, ponderadas por 
su importancia jerárquica en la red de drenaje. 

Relacionado con la exposición visual, encontramos otros análisis derivados, 
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de gran importancia en muchos estudios. Uno de ellos es el análisis de cobertura, 
que pretende calcular las formas óptimas de cubrir un terreno, de forma que un 
numero mínimo de observadores pueda observar la totalidad de un área. Dos son 
los análisis principales en este sentido: determinar el número mínimo de puntos 
y su localización para que todo un área quede bajo observación, o determinar la 
localización de un número n de puntos que hace máxima el área observada. 

Análisis como estos son útiles para determinar dónde establecer torres de 
vigilancia de incendios o repetidores de telefonía móvil, entre otros, maximizando 
la eficiencia de los mismos. 

Si los análisis de exposición visual ya implican un gran número de cálculos y 
requieren mucho tiempo de proceso, los análisis de cobertura añaden elementos 
combinatorios que hacen que sea imposible tratar el problema mediante un análisis 
por fuerza bruta (comprobando las posibles soluciones y eligiendo simplemente la 
mejor). Por ellos, estos análisis utilizan métodos heurísticos y se basan en Modelos 
Digitales de Elevaciones en formato TIN, ya que en ellos el análisis de visibilidad 
es menos costoso en términos de número de operaciones necesarias (el número de 
vértices de un TIN es sensiblemente menor que el número de celdas de una capa 
ráster). En [259] pueden encontrarse más detalles al respecto. 


15.8. Caracterización de formas del terreno 

Las distintas formas del terreno pueden clasificarse en base a parámetros mor- 
fométricos o mediante análisis locales similares a los empleados para obtener estos. 

El número de clases distintas y el significado de estas varía en función del 
tipo de clasificación y el método, existiendo gran diversidad tanto en la propia 
clasificación como en la metodología. 

Con independencia del método, el tamaño de la ventana de análisis medido 
en unidades sobre el terreno (no en número de celdas) es de vital importancia para 
obtener resultados coherentes. Como ya quedo claro en la sección 10.2.1, un mismo 
relieve puede ser caracterizado de distintas formas en función de la escala a la que 
se analice. Es por ello que resulta clave la elección de una escala de análisis que 
se corresponda con el estudio del relieve que pretendemos realizar, ya sea este a 
nivel de microtopografía o de macrorelieve. 

Una primera clasificación la podemos obtener a partir del análisis de curvaturas. 
En particular, tomando las curvaturas horizontal y vertical, podemos combinar 
estas y definir nueve grupos distintos que caracterizan los procesos de acumulación 
[260] . Se establece un valor mínimo en valor absoluto, por debajo del cual las celdas 
se consideran sin curvatura, es decir, planas. Los valores continuos de curvatura 
pueden ahora categorizarse en tres clases: convexa, cóncava o plana. Cruzando 
estos tres grupos para las dos curvaturas, obtenemos el conjunto de las nueve clases 
posibles (Figura 15.31). 
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Kv<0 Kv=0 Kv>0 



Figura 15.31: Caracterización de procesos de acumulación según los valores de las 
curvaturas horizontal y vertical asociadas 


Recordando el significado de las curvaturas, tendremos procesos de acumula- 
ción en las celdas con ambas curvaturas cóncavas, ya que el flujo se concentrará 
y tenderá a frenarse. Del mismo modo, las celdas con ambas curvaturas conve- 
xas registrarán procesos de dispersión. Entre estas, las combinaciones restantes 
identifican zonas de tránsito con diversas características. 

Con un planteamiento similar, [194] propone una división en 6 formas del 
relieve a partir de los valores de las segundas derivadas (Cuadro 15.2). 


Tipo 

d 2 z 

dx 

a 2 z 

dy 

Cima 

+ 

+ 

Collado(Punto de silla) 

+ 

- 

Cresta 

+ 

0 

Plano 

0 

0 

Cauce 

- 

0 

Depresión 

- 

- 


Cuadro 15.2: Clasificación de formas del terreno en función de segundas derivadas, 
según [194]. 

Otra metodología distinta y muy aceptada es la propuesta por [261]. Con 
anterioridad a la aparición de los Modelos Digitales del Terreno, [262] estableció 
una clasificación del relieve en base a tres parámetros: la pendiente, el relieve 
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relativo y la forma del perfil. El relieve relativo es el rango de valores de elevación 
en un entorno dado del punto, y el tipo de perfil se calcula con la distribución de 
pendientes en los puntos circundantes. Esta clasificación da un total de 96 clases 
posibles, derivadas de la división de los anteriores parámetros base en cuatro, seis 
y cuatro clases respectivamente, así como la combinación posterior de los mismos. 

[261] adapta este planteamiento al empleo de MDE, de tal modo que se obtienen 
de forma automática mapas de formas del relieve a partir de estos. Estableciendo 
una ventana de análisis de un tamaño fijo (9.6 km originalmente), el parámetro 
relativo a la pendiente se obtiene mediante el recuento de celdas en la ventana que su- 
peran un umbral dado (8% en dicha formulación original) . El valor de este recuento, 
expresado en porcentaje de celdas totales de la ventana, se divide en cuatro clases. 

■ menos del 20% de celdas con pendiente mayor que el umbral. 

■ entre el 20 y el 50% de celdas con pendiente mayor que el umbral. 

■ entre el 50 y el 80% de celdas con pendiente mayor que el umbral. 

■ más del 80% de celdas con pendiente mayor que el umbral. 

Para el caso del relieve relativo, se establecen asimismo seis grupos, a aplicar 
sobre el rango de valores en la misma ventana utilizada para el parámetro anterior: 

■ 0 - 30 m 

■ 30-91 m 

■ 91- 152 m 

■ 152- 305 m 

■ 305- 915 m 

■ más de 915 m 

Por último, se define el tipo de perfil viendo si las celdas con pendiente ma- 
yor que el umbral tienen elevación mayor o menor que la central. Se definen las 
siguientes 4 clases. 

■ menos del 25% de celdas con pendiente mayor que el umbral situadas en 
zonas de mayor elevación. 

■ entre el 25% y el 50% de celdas con pendiente mayor que el umbral situadas 
en zonas de mayor elevación. 

■ entre el 50% y el 75% de celdas con pendiente mayor que el umbral situadas 
en zonas de mayor elevación. 

■ más del 75% de celdas con pendiente mayor que el umbral situadas en zonas 
de mayor elevación. 

Un enfoque bien distinto es el basado en clasificación no supervisada. La forma- 
ción del relieve es un proceso que depende de muchos factores, no únicamente los 
relativos a la morfometría local. Combinando algunos de los parámetros que hemos 
visto hasta el momento, pueden establecerse clasificaciones a partir de técnicas de 
clasificación no supervisada (las estudiaremos en el apartado 20.2.2). Por ejemplo, 
[263] emplea como parámetros la propia elevación, la pendiente, las curvaturas 
horizontal y vertical, el índice topográfico y la radiación solar. Estableciendo un 


número de clases a definir, se obtienen una categorización de las celdas de acuerdo 
con las formas del relieve que representan. 

De igual modo, puede plantearse un análisis similar pero utilizando clasificación 
supervisada [264], o emplear no una clasificación discreta, sino un basada en el 
uso de lógica difusa [265] [263] [266] . Veremos algunas ideas sobre lógica difusa 
más adelante en este libro, particularmente en el apartado 20.4.1. 

15.9. Resumen 

El MDE es una capa de información fundamental, y de él pueden extraerse un 
número muy elevado de nuevos parámetros. El formato ráster de malla regular es el 
más adecuado para ello, aunque debe prepararse para que los resultados derivados 
sean correctos, en especial los de corte hidrológico. 

El análisis del MDE mediante funciones focales se puede llevar a cabo mediante 
parámetros estadísticos, así como mediante parámetros geométricos. Estos últimos 
requieren una caracterización matemática del relieve, para poder sobre ella aplicar 
las herramientas del calculo diferencial. Los parámetros basados en derivadas de 
primer orden son la pendiente y la orientación, así como, en función de estos, el 
estudio de la insolación, que puede extenderse mediante conceptos de visibilidad. 
Los basados en derivadas de segundo grado son las curvaturas, entre las cuales 
destacan las denominadas curvatura horizontal y vertical. 

Dentro del análisis hidrológico, existen diversos métodos para la asignación 
de direcciones de flujo. El D8 es el más elemental de ellos, y constituye la base 
conceptual de gran parte de los restantes. Estos nos permiten establecer relaciones 
entre las celdas y proceder así a un estudio regional. El área aportante es el pa- 
rámetro principal de dicho análisis, y se puede emplear como parámetro de apoyo 
para la extracción de redes de drenaje. 

La combinación de parámetros, en particular área aportante y pendiente, da 
lugar a índices hidrológicos de gran interés. 
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Capítulo 16 


Procesado de imágenes 


Las imágenes constituyen un tipo particular de dato a partir del cual puede derivarse 
abundante información. Ya sea como elementos meramente visuales cuyo único fin es la 
representación junto a otras capas de información, o bien como base para análisis más 
complejos, las imágenes son uno de los componentes más importantes del uso habitual de un 
SIG. Sus particularidades las hacen merecedoras de un capitulo propio dentro del cual tratar 
aquellos análisis desarrollados especialmente para este tipo de datos, que comparten, no 
obstante, cierto número de sus principios fundamentales con otros de los análisis ya vistos. 

Puesto que las imágenes se almacenan en formato ráster, es esencial comprender este 
formato para seguir el contenido del capítulo, así como los distintos tipos de imágenes y 
sus procedencias, esto último según se vio en el capítulo 6. Igualmente, los elementos del 
álgebra de mapas, por compartir elementos comunes, deben conocerse para entender la 
aplicación de estos al análisis de imágenes. 

Al final de este capítulo se tendrá una visión genérica de la potencialidad que las 
imágenes presentan de cara al análisis geográfico. 


16.1. Introducción 

Las imágenes como tipo de dato son parte de los SIG desde prácticamente su 
origen, y las formulaciones dedicadas al análisis de estas existen también desde 
entonces y son un campo muy desarrollado. Este análisis representa una de las áreas 
más ricas, combinando aquellas formulaciones que consideran la naturaleza del tipo 
particular de imágenes que se usan en un SIG — esto es, el hecho de que son imágenes 
de la superficie terrestre — junto con las que existen para el análisis y proceso de 
imágenes digitales en general. Estas últimas constituyen por sí solas un amplio 
grupo de técnicas que, en conjunto con las dedicadas al análisis de datos espaciales, 
forman una serie de herramientas de gran utilidad para el uso genérico de los SIG. 

Si la consideramos simplemente como una estructura de datos, una imagen no es 
sino una capa ráster más. Tiene la estructura regular de una capa ráster y contiene en 
cada celda (cada píxel de la imagen) el valor asociado a una variable dada. Particular- 
mente, esta variable es la intensidad de la reflectancia en una longitud de onda dada. 

No existe diferencia «formal» entre un MDE creado a partir de la información 
recogida por un sensor remoto tal como los utilizados, por ejemplo, para la Shuttle 
Radar Topographic Misión (SRTM), y una imagen de satélite tal como las que 
proporciona el satélite LANDSAT (salvo el hecho de que esta última contiene 
varias bandas en lugar de una única). No obstante, la naturaleza de la variable 
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recogida en la imagen y la componente visual intrínseca a la misma hacen que el 
campo del análisis de imágenes presente sus particularidades, que serán las que 
veremos a lo largo de este capítulo. 

En conjunto, estudiaremos los elementos básicos del análisis de imágenes di- 
gitales, así como las formulaciones específicas para el caso de imágenes aéreas o 
procedentes de teledetección, es decir, las formulaciones específicas para el tipo 
de análisis que se realiza en un SIG. Algunas formulaciones más particulares se 
verán en la parte dedicada a las aplicaciones. 

Tanto uno como otro de estos grupos son muy extensos, y en el espacio de 
este capítulo no pueden recogerse sino las formulaciones más habituales y útiles 
de ambos. La teledetección queda en muchas ocasiones fuera de los textos al uso 
sobre SIG, como una disciplina con entidad propia, relegándose también junto a 
ella al procesado de imágenes. No obstante, los SIG no pueden entenderse hoy día 
sin el concurso de imágenes, ya sea como elementos visuales o como objetos de 
análisis, y las metodologías dedicadas a su procesado deben recogerse al menos 
en cierta medida en un libro como este. 

Debido a lo extenso de la materia a tratar y a la fuerte componente matemática 
con la que puede presentarse, se ha simplificado la exposición, incluyendo estos 
elementos matemáticos en limitadas ocasiones y dando más peso al aspecto prácti- 
co. En caso de que el lector esté interesado, las referencias indicadas a lo largo del 
capítulo contienen descripciones detalladas de las fórmulas y procesos que definen 
cada una de las operaciones sobre imágenes que veremos a continuación 

16.1.1. La utilidad de las imágenes en un SIG 

Antes de estudiar las técnicas de procesado de imágenes, debemos conocer 
la utilidad que estas tienen cuando son incorporadas a un SIG. Debemos tener 
en cuenta que no se trata de un dato tan genérico como, por ejemplo, una capa 
ráster. En esta podríamos almacenar tanto variables continuas como categóricas, 
y ya sean de un tipo o de otro, pueden ser variables de naturaleza muy variada, 
desde un valor de temperatura a uno de presión, pasando por el tipo de suelo o el 
número de individuos presentes en una celda de la capa. Las imágenes presentan 
una amplitud menor en cuanto a la información que pueden contener, y aunque 
como ya vimos existe gran variabilidad en los contenidos dependiendo de la forma 
de recogida de dicha información, esto restringe y condiciona los resultados que 
pueden perseguirse a través del análisis de estas imágenes. 

En líneas generales, podemos identificar los siguientes procesos, que serán a 
los que se adapten las técnicas que veremos a lo largo del capítulo. 

■ Representación. Las imágenes son, ante todo, elementos visuales, y en 
muchos casos no se utilizan más que para conformar una base sobre la que 
emplazar otras capas. En este sentido, las imágenes son utilizadas para 
proveer un contexto visual en el entorno de trabajo de un SIG. 
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Este libro contiene una parte entera dedicada a la generación cartográfica, 
en la cual se tratan aspectos relativos a la representación de todo tipo de 
capas de datos espaciales, entre ellas las imágenes. No obstante, la literatura 
es abundante en algoritmos que permiten mejorar las capacidades que una 
imagen tiene de transmitir su información o de establecer ese citado contexto 
visual, y estos algoritmos se detallarán en este capítulo. 

■ Identificación de elementos. La realidad que se refleja en una imagen 
esta compuesta por los objetos presentes sobre la superficie terrestre. Arboles, 
carreteras, zonas de distinta vegetación, así como otros muchos elementos 
de pequeño o gran tamaño son los que constituyen esa realidad. Conocemos 
ya fórmulas para tratar con esos elementos y estudiarlos dentro de un SIG. 
Obtener a partir de las imágenes nuevas capas que los contengan es una 
tarea habitual que pone de manifiesto la gran utilidad de estas. 

La identificación y delineación de estos elementos puede implicar la creación 
de nuevas capas vectoriales o bien de capas ráster, así como las transforma- 
ciones encaminadas a que dichas operaciones de identificación se realicen 
de manera lo más precisa posible. 

■ Identificación de características. Si tomamos una imagen, podemos 
identificar por sus formas una carretera, y decir si es ancha o estrecha, larga 
o corta, o bien si es sinuosa o rectilínea. Estos parámetros geométricos son los 
que nos ayudan a identificar el elemento en sí, según lo comentado en el punto 
anterior, pero no es solo lo referente a la geometría lo que una imagen puede 
contener acerca de esa carretera. Mirando esa misma imagen, es probable 
que podamos decir por su color si el firme es asfaltado o, por el contrario, 
es de tierra y se trata de un camino. Esta identificación de las propiedades 
de un elemento, o bien de una simple celda aislada, es otra de las funciones 
básicas que se llevan a cabo a partir de imágenes. 

Dentro de este grupo merecen especial mención aquellas formulaciones que 
estiman propiedades físicas de los elementos recogidos en la imagen. Con 
los valores de una imagen puede estimarse desde el vigor vegetativo de una 
masa arbórea hasta la turbidez del agua de un embalse, entre otros muchos 
parámetros físicos de diversa índole. 

16.1.2. Tipos de procesos con imágenes 

Teniendo en consideración las anteriores utilidades básicas de las imágenes 
en un SIG, las operaciones sobre estas imágenes pueden dividirse en tres grupos 
principales: 

■ Corrección. Los equipos empleados para recoger las imágenes pueden in- 
corporar errores, ruido, o distorsiones. Eliminar o tratar estas para que su 
efecto sea menor es un proceso previo que en la mayoría de los casos es un 
requerimiento imprescindible antes del análisis. 
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■ Mejora. La mejora es el paso siguiente a la corrección. Una vez que las imá- 
genes han sido corregidas, la información que contienen puede hacerse más 
explícita a través de distintos tipos de modificaciones. En el análisis visual, la 
mejora de una imagen hace que sea más sencillo percibir el contenido de esta 
y darle un uso directo. Las características de esa carretera o su propia forma, 
pueden verse más claramente. Cuando estos procesos de identificación de ele- 
mentos y características se realizan de forma automática mediante algoritmos 
y no manualmente, también es importante una preparación de las imágenes pa- 
ra mejorarlas de cara a este proceso. Mejorando una imagen, mejoramos tam- 
bién la capacidad de esos algoritmos de «ver» la información que pretendemos 
obtener, de un modo muy similar a como sucede con un observador humano. 

■ Extracción de información. Los valores de las distintas bandas de una 
imagen pueden emplearse para derivar otros nuevos, tales como variables de 
tipo físico o pertenencia a clases predefinidas que pueden identificar los ele- 
mentos presentes sobre el terreno. Estos procesos implican una interpretación 
de la imagen en cuestión. 

16.1.3. Análisis visual y análisis automático 

Las tareas de corrección y mejora van a implicar necesariamente la utilización de 
algoritmos, los cuales veremos en las siguientes secciones. Estas operaciones, como 
hemos dicho, favorecen el buen desarrollo de la extracción de información posterior, 
y mejoran los resultados obtenidos. Las operaciones de extracción de información, al 
contrario que las anteriores, pueden llevarse a cabo tanto manualmente y de forma 
visual(por ejemplo, digitalizando directamente en pantalla) , como de forma automa- 
tizada (veremos algoritmos para ello en este capítulo, así como en otros posteriores) . 
Existe, pues, un análisis manual que requiere un operario visualizando y tratando 
una imagen, y otro automático en el que se deja al propio SIG realizar esta tarea. 

Algunas de las principales diferencias entre el análisis visual y el automático se 
enuncian a continuación. Estas condicionan la utilización de una u otra solución 
en función de las necesidades. 

■ El análisis visual requiere conocimientos más sencillos e intuitivos, mientras 
que el automático requiere conocimientos técnicos para ajustar los algoritmos 
que realizan el proceso. 

■ Mientras que el análisis visual se basa tanto en las propiedades espaciales 
como en las tonalidades de la imagen, en el caso de un análisis automático, 
este se basa fundamentalmente en los valores de refiectancia, incorporando 
en ocasiones cierta componente espacial. Las propiedades de forma, tamaño 
u orientación, aunque importantes como vimos en el apartado anterior, 
resultan más difíciles de ser reconocidas y empleadas por los algoritmos 
correspondientes que las basadas en el análisis de los Niveles Digitales. 

■ El ojo humano puede analizar imágenes en blanco y negro o en color, pero es 
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difícil que pueda trabajar con imágenes con más bandas, que pueden llegar 
incluso a cientos. Por ello, las imágenes multi e hiperespectrales se analizan 
de forma habitual mediante algoritmos y procesos automatizados, mientras 
que el análisis visual queda limitado para las imágenes más sencillas. Como 
veremos más adelante, pueden crearse representaciones en color de las imá- 
genes con elevado número de bandas, acercando de ese modo la posibilidad 
de un análisis visual de las mismas, aunque en ningún caso de la totalidad 
de bandas, sino solo de un subconjunto muy reducido de ellas. De igual 
modo, una banda aislada puede analizarse visualmente, pero ello no permite 
acceder a toda la información que el conjunto de bandas de la imagen puede 
aportar, mientras que el análisis no visual no se encuentra restringido por 
las limitaciones propias de la visión humana. 

■ La naturaleza del análisis automatizado es fundamentalmente cuantitativa, 
incorporando formulaciones estadísticas o análisis matemáticos basados en 
los valores que se recogen en cada píxel. Por el contrario, el análisis visual se 
basa en propiedades cualitativas de los elementos de la imagen, más sencillas 
de percibir e interpretar por quién desarrolla dicho análisis. 

Es importante tener en cuenta estas diferencias, ya que las circunstancias en 
las que va a ser necesaria la interpretación de una imagen pueden ser muy variadas, 
debiendo en cada caso procederse a ella de la forma más adecuada. 


16 . 2 . Correcciones y preparación de imágenes 

Del mismo modo que un MDE contiene depresiones irreales (véase capítulo 15) 
que deben ser corregidas antes de proceder a su análisis hidrológico, las imágenes 
presentan también otros elementos que hacen necesaria una preparación antes 
de pasar al uso propiamente dicho. Estos elementos están relacionados con la 
forma en que los sensores capturan la información y las imprecisiones que en este 
proceso pueden aparecer, y tratan de eliminar estas imprecisiones para que los 
Niveles Digitales de las distintas celdas reflejen fielmente la realidad presente en 
el momento de capturar dicha imagen. 

Independientemente del número de bandas de la imagen, las correcciones se 
realizan de forma individual para cada una de las bandas, ya que algunos de los 
errores pueden aparecer solo en parte de dichas bandas, y no necesariamente sobre 
todas ellas de forma simultanea para un mismo píxel. 

Los tipos principales de deficiencias que puede contener una imagen son los 
siguientes: 

■ Geométricas. Distorsiones de forma provocadas por los movimientos y 
oscilaciones del sensor, o por el relieve del terreno, entre otros factores. Con 
una base conceptual relacionada con las técnicas de corrección de estas 
deficiencias, existe un paso básico que debemos llevar a cabo en muchos 
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casos: la georreferenciación de la imagen. Para incorporar dicha imagen 
dentro del ámbito de un SIG, es necesario que le asignemos una referencia 
geográfica ya que, como bien sabemos, todos los datos espaciales han de 
tener definida su posición en el espacio. Cuando esta referencia no existe, 
es necesario llevar a cabo un proceso que la defina. 

■ Radiométricas. Valores incorrectamente recogidos por el sensor. Pueden 
ser debidas a errores del sensor o introducidos en el proceso de almacena- 
miento o transmisión, o bien a distorsiones debidas al efecto que la atmósfera 
ejerce sobre la radiación (y por tanto sobre los valores recogidos). 

16.2.1. Corrección geométrica 

Por la propia naturaleza del proceso de toma de imágenes, estas presentan ha- 
bitualmente diversas formas de distorsión geométrica. Entre ellas, cabe mencionar 
las debidas a los siguientes factores [267] 

■ La rotación de la Tierra durante la toma de la imagen. 

■ La frecuencia de escaneo del sensor. 

■ La curvatura de la Tierra. 

■ Los efectos panorámicos. 

■ Las variaciones en la velocidad y altura de la plataforma de registro. 

Para disminuir estos efectos existen una serie de métodos cuya finalidad es 

corregir y distorsionar la imagen original con objeto de que esta constituya una re- 
presentación más fiable de la escena original [50] . Dos son los métodos más utilizados 
para la corrección geométrica de las imágenes: la rectificación y la ortorectificación. 

Rectificación 

El proceso de rectificación se fundamenta en el establecimiento de una corres- 
pondencia entre las coordenadas de los píxeles de la imagen y las coordenadas 
reales sobre el terreno de los objetos que estos píxeles representan. Por medio de 
una función de transformación de la forma 

(x',y') = f(x,y) (16.2.1) 

se establece la anterior correspondencia, que permite modificar la imagen original 
y obtener una nueva. Esta, como resultado de las distorsiones y modificaciones 
que se introducen, refleja más fielmente el terreno y corrige los errores geométricos 
que han aparecido durante la toma de la imagen. 

El proceso de rectificación implica el cálculo de la función de transformación, 
para lo cual se emplea un conjunto de puntos de referencia o puntos de control 1 . 

1 Estos puntos de control son similares a los que veíamos en el caso de utilizar una tableta 
digitalizadora, cuyo uso explicamos en el capítulo 6 
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Estos son elementos puntuales de los cuales se conoce con exactitud sus coorde- 
nadas reales (bien habiéndolas tomado sobre el terreno o bien con una imagen 
ya corregida cuya georreferencia pueda emplearse como dato fiable) , y pueden 
localizarse en la imagen. Identificando estos puntos y localizándolos sobre la imagen 
a corregir se puede calcular la transformación de tal forma que al aplicar dicha 
transformación sobre los puntos de control, pasen a tener las coordenadas que 
realmente les corresponden con un error mínimo. 

Los puntos de control deben buscarse en elementos del terreno que sean 
fácilmente localizables y que puedan definirse con la mayor precisión posible. Cruces 
de caminos u otros puntos singulares son habitualmente empleados para este fin. 
Lógicamente, la elección de estos puntos depende de la resolución de la imagen, ya 
que elementos tales como vértices geodésicos, muy aptos para ser puntos de control, 
pueden verse en las imágenes de gran resolución pero no en las de menor resolución. 

Con los puntos de control determinados, debe elegirse un tipo de función para 
ajustar. Una transformación afín puede ser una opción inicial, pero las modifica- 
ciones que permite (rotación, traslación y cambio de escala) no son suficientes para 
la corrección de las distorsiones geométricas habituales, ya que estas son de una 
naturaleza más compleja. Funciones de segundo o tercer grado son las opciones 
más habituales que cumplan los requisitos necesarios, ajustándose estas mediante 
mínimos cuadrados. 

El número de puntos de control debe ser mayor al estrictamente necesario para 
poder realizar el ajuste, ya que la redundancia que aportan los puntos adicionales 
da significación estadística a la bondad de este. 

En base a los puntos de control puede calcularse la bondad del ajuste mediante 
el cálculo del error medio cuadrático. Por muy precisa que sea la transformación 
que realicemos, esta núnca va a asignar a todos los puntos de control la coordenada 
correcta que les corresponde, y que es la que hemos usado para definir dicha 
transformación. Las discrepancias entre esas coordenadas reales de los puntos de 
control y las asignadas a los mismos a partir del polinomio ajustado definen el 
error medio cuadrático del ajuste según la siguiente expresión: 


EMC 


UL Axi-xtfHm-yd 2 

N 


(16.2.2) 


Para poder calcular el error medio cuadrático, se necesita al menos un punto de 
control más que el mínimo necesario para ajustar la función polinómica utilizada. 

El proceso de rectificación no solo puede emplearse para la corrección geo- 
métrica de una imagen que dispone de una referencia geográfica incorrecta por 
presentarse distorsiones y deformaciones. También puede utilizarse para georre- 
ferenciar imágenes que carecen por completo de toda referencia geográfica. 

Este caso, como vimos, es el habitual cuando utilizamos imágenes aéreas en 
formato impreso o mapas en papel, que han de ser escaneados (digitalizados) para 
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poder incorporarse como datos dentro de un SIG, según vimos en el apartado 
6.5.2. El proceso de escaneado digitaliza la imagen pero no la referencia geográfica 
de esta en caso de que exista. Las marcas fiduciales o la coordenadas señaladas 
en un mapa no son interpretadas como tales una vez la imagen resultante de la 
digitalización se incorporar a un SIG. Por ello, es necesario definir dicha referencia 
geográfica para que la imagen adquiera todo su significado. 

El proceso se lleva a cabo de igual modo, localizando puntos de control en la 
imagen (de los cuales solo se conocen sus coordenadas dentro de la imagen, en el 
espacio de referencia de los píxeles) , y dándoles coordenadas reales en base a las 
cuales pueda definirse la transformación correspondiente. 

La imagen 16.1 muestra un ejemplo gráfico de este proceso. Se dispone de un ma- 
pa escaneado sin coordenadas, y una imagen de la que sí se conocen las coordenadas 
de cada píxel, pues ha sufrido un proceso de georreferenciación y corrección previo. 
Localizando un número suficiente de puntos singulares en ambas imágenes, puede 
establecerse la transformación que permite asignar coordenadas a todos los píxeles 
del mapa escaneado. Una vez el proceso se ha realizado, este mapa escaneado puede 
ya emplearse dentro de un SIG junto con cualquier otra capa que represente esa 
misma porción del terreno, pues contienen toda la referencia geográfica necesaria. 



Figura 16.1: Proceso de referenciación de una imagen (mapa escaneado), empleando para 
la localización de puntos de control (en amarillo) una fotografía aérea ya georreferenciada. 
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Ortorrectificación 

La ortorrectificación persigue un objetivo similar a la rectificación, pero incluye 
un factor adicional: la elevación. En lugar de darse una transformación plana, esta 
es de tipo espacial, ya que utiliza los valores de elevación correspondientes a los 
distintos píxeles para proceder al ajuste. 

Esta elevación provoca un desplazamiento aparente de los píxeles y, según el caso, 
puede ser tan necesario corregir este efecto como lo es el hacerlo para las distorsiones 
del plano. En la figura 16.2 se muestra una fotografía aérea antes y después del 
proceso de ortorrecificacion. A esta segunda se la denomina orto fotografía. 



Figura 16.2: Fotografía aérea antes y después del proceso de ortorrectificación 

La figura 16.3 muestra claramente el efecto de las distorsiones que derivan del 
relieve del terreno o de la propia altura de los elementos fotografiados, tales como 
grandes edificios. 

La ortofotografía tiene una escala uniforme, y es como una versión fotográfica 
de un mapa de esa zona. Por esta razón, pueden medirse áreas y distancias en ella, 
o utilizarla para superponer sobre ella otras capas. En una imagen sin ortorrec- 
tificar, y cuando las distorsiones geométricas derivadas del relieve son notables, 
la medición daría lugar a valores erróneos y la superposición con otras capas no 
tendría una coincidencia completa. 

Puesto que se emplean las elevaciones, el concurso de un Modelo Digital de 
Elevación es imprescindible, pudiendo este proceder del mismo origen que la propia 
imagen a ortorectificar (en caso de que el sensor ofrezca igualmente pares de 
imágenes estereoscópicas, y procediendo de la forma que vimos en la sección 6.5.4), 
o bien de otra fuente distinta. 

El proceso de ortorrectificación es complejo y tiene una base matemática 
extensa. El lector interesado puede encontrar más detalles, por ejemplo, en [268] . 
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Figura 16.3: Las distorsiones provocadas por el hecho de que la escena fotografiada no 
es plana se aprecian con claridad en esta imagen. 


16.2.2. Corrección radiométrica 

La corrección radiométrica corrige valores erróneamente registrados o ruido 
presente en la imagen, entre otras alteraciones que pueden aparecer en esta. Existen 
muchas razones por las que el Nivel Digital recogido en un píxel puede no ser 
correcto y no reflejar con fidelidad la realidad presente sobre el terreno. 

En algunos casos el valor que aparece en el píxel es un valor erróneo del cual 
no puede extraerse información alguna. Este caso se presenta, por ejemplo, si en el 
proceso de almacenamiento se ha producido una mala transmisión y algunos píxeles 
se han «perdido». La información necesaria para establecer un valor correcto en 
dichos píxels no puede tomarse del propio píxel, sino que es necesario recurrir a los 
píxeles circundantes o a otros elementos tales como el histograma de la imagen. 

En otros casos, no obstante, el Nivel Digital del píxel sí contiene información 
valiosa, y lo que es necesario es transformar este, ya que, debido a la influencia de 
factores externos, no es exactamente el que debiera corresponderle. El conocimiento 
de esos factores externos es necesario para poder realizar esta transformación. 

En función de la causa que los ha originado, distinguimos los siguientes tipos 
de errores: 

■ Errores debidos a los sensores. Los sensores pueden introducir errores 
en las imágenes tanto en forma de distorsión como en forma de ruido, ya sea 
este regular o aleatorio. Por ejemplo, los sensores ópticos pueden presentar 
distorsiones achacables a las lentes, que con frecuencia se manifiesta en áreas 
más oscuras en el borde de las imágenes en comparación con las celdas centra- 
les. En el caso de sensores electro-ópticos, deben emplearse datos auxiliares 
para la calibración de estos y así garantizar el registro correcto de los valores 
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correspondientes. Errores habituales dentro de este grupo son igualmente 
los píxeles o líneas perdidas, apareciendo píxeles aislados o líneas completas 
cuyos valores deben descartarse. La estimación de valores para dichos píxeles 
o líneas se realiza empleando los valores de píxeles circundantes, pues existe 
una relación clara entre ellos. El empleo de filtros (ver más adelante el apar- 
tado 16.3.2), es una técnica habitual para realizar esta corrección. Existe 
también correlación entre las distintas bandas de una imagen, por lo que no 
solo pueden utilizarse los píxeles de la misma banda, sino también los propios 
píxeles perdidos, pero en otras bandas. En general, los sensores que recogen 
las distintas longitudes de onda (las distintas bandas) son independientes, 
por lo que el error no debe aparecer en todas ellas. 

■ Errores debidos a la topografía. Además de producir distorsiones geo- 
métricas como ya hemos visto, las formas del relieve condicionan la forma 
en que la radiación es reflejada, ya que dicha reflexión esta condicionada 
por el ángulo de incidencia. El uso de Modelos Digitales de Elevaciones e 
información sobre las condiciones de iluminación en las que se ha tomado la 
imagen permite plantear modelos de iluminación que pueden corregir estos 
efectos. Existen diversas formas de aplicar una corrección a una imagen y 
eliminar el efecto de la topografía, algunas de ellas relativamente simples. 
Una formulación simple es la siguiente: 

• A partir de un Modelo Digital del Elevaciones se calcula una capa de 
relieve sombreado. Los parámetros empleados para su creación (azimut 
y elevación) deben coincidir en la medida de lo posible con las existentes 
en el momento en que la imagen fue recogida. 

• Se realiza una regresión entre esta capa de relieve sombreado y la imagen 
a corregir, de forma que se tenga una función de la forma y = ax+b. 

• Se aplica la transformación definida por la anterior ecuación a los valores 
de la capa de relieve sombreado. 

• Se resta la capa resultante a la imagen a corregir. 

• Se suma a la capa resultante del paso anterior el valor de reflectancia 
media de la imagen original. 

■ Errores debidos al efecto de la atmósfera en la radiación. Los errores 
debidos a la atmósfera son de los más importantes dentro de los que provocan 
alteraciones radiométricas en la imagen, y son estudiados en ocasiones de 
forma independiente, en lugar de como un subtipo de error radiométrico. 
Para comprender la necesidad de esta corrección debe tenerse en cuenta que 
en algunos casos lo que interesa de la imagen no son los Niveles Digitales, 
sino una variable con sentido físico como la radiancia correspondiente a cada 
longitud de onda. Será esta radiancia la que luego se analice para la obtención 
de otros parámetros físicos derivados, y su obtención se realiza a partir de los 
Niveles Digitales aplicando ecuaciones lineales con parámetros dependientes 
del sensor. El problema estriba en que la radiancia que se obtiene al aplicar 
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este proceso es la que ha alcanzado el sensor, que no ha de corresponderse 
necesariamente con la que se tiene sobre el terreno o la que recibiría el sensor si 
estuviera a una distancia mínima del objeto. La atmósfera afecta a la radiación 
en su camino desde el suelo hasta el sensor, y distorsiona la información 
recogida. Los efectos atmosféricos son principalmente de dos clases: difusión 
y absorción. La difusión es causada por las partículas de pequeño tamaño 
de la atmósfera, que desvían una parte de la energía radiante, alterando 
su dirección. La modificación que se produce depende del tamaño de las 
partículas implicadas en relación con la longitud de onda de la radiación [269] . 
La absorción, por su parte, se produce cuando los elementos constituyentes 
de la atmósfera absorben parte de la radiación para emitirla posteriormente 
en una longitud de onda distinta. La intensidad de la radiación disminuye 
con el efecto de la difusión. Ambos efectos conjuntos producen un efecto de 
«neblina» en la imagen, restándole contraste. La difusión, asimismo, tiene 
un efecto adicional de adyacencia, ya que cada píxeles recoge parcialmente 
la radiación que en realidad debería corresponder a otros píxeles contiguos. 
La corrección de los efectos atmosféricos es compleja y existen muchas 
formulaciones distintas que escapan al alcance de este texto. Para saber más, 
una buena descripción de estos métodos puede encontrarse en [270] 

16.3. Mejoras 

Una vez las imágenes están corregidas, puede procederse a su análisis. Este, no 
obstante, en especial el de tipo visual, puede proporcionar mejores resultados si se 
tratan los valores de la imagen con anterioridad, efectuando ajustes encaminados 
a mejorar las imágenes como datos de partida. Este tipo de tratamiento no es 
imprescindible, pero sí interesante de cara a preparar las imágenes, y existen 
numerosos métodos para ello. 

Podemos comprender mejor esto si pensamos en el tratamiento de imágenes 
fotográficas habituales. Los métodos que se aplican para realzar el color de estas, 
enfocar zonas borrosas, o ajustar el brillo o el contraste, entre otros, se pueden 
aplicar de idéntica forma a imágenes aéreas o de satélite. El efecto que tienen sobre 
estas es similar, mejorando la forma en que las percibimos, y también la forma 
en que sus valores pueden ser analizados en otros procesos posteriores. 

Todos estos procesos son elementos del análisis de imágenes digitales genéri- 
cas, que al ser aplicados sobre imágenes aéreas o de satélite mantiene su mismo 
significado y utilidad a pesar del contexto particular en el que se utilizan. 

16.3.1. Operaciones píxel a píxel 

Las operaciones de esta clase se corresponden con las funciones de tipo local 
del álgebra de mapas, ya que toman el Nivel Digital de un píxel de la imagen 
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original y únicamente en función de su valor calculan el del mismo píxel en la 
imagen resultante. Por ello, todas estas operaciones tienen la forma 

ND' = f(ND) (16.3.1) 

Según sea la función, tenemos un tipo u otro de operación, con un efecto 
concreto. Para mostrar estas funciones de forma gráfica, emplearemos gráficas 
como la siguiente, la cual se corresponde con la transformación identidad. 



La gráfica establece una relación entre el Nivel Digital original y su tonalidad 
asociada (en abscisas) y los correspondientes en la imagen resultante (en ordenadas) . 
Aplicando esta transformación a todos los píxeles, se obtiene la imagen mejorada. 

A la hora de definir estas funciones de transformación, un elemento de utilidad 
es el histograma, ya que da una visión global de los Niveles Digitales presentes en el 
conjunto de píxeles de la imagen. La distribución de Niveles Digitales representada 
en el histograma aporta una información a partir de la cual pueden definirse estas 
operaciones de mejora a nivel de píxel. 

Segmentación 

La primera operación que veremos es la segmentación , cuyo objetivo es par- 
ticionar una imagen en diversas regiones en base a criterios de homogeneidad o 
heterogeneidad [271]. 

Aunque veremos que existen muchas formas de segmentación, en su forma más 
básica se trata de una operación píxel a píxel cuyo resultado es lo que conocemos 
como una imagen binaria. Esto quiere decir que dicha imagen tiene únicamente dos 
valores: uno de ellos representa lo que se conocen como objetos (que se representan 
habitualmente en negro), y otros representan el fondo de la imagen (habitualmente 
blanco). 

Este procedimiento nos sirve para separar partes de la imagen en función de sus 
valores. Muy frecuentemente, encontraremos en una imagen algunos elementos que 
nos resultarán de interés (por ejemplo, una carretera a lo largo de una zona desierta, 
claramente diferenciable) , y resultará de interés separar esos elementos del resto 
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de la imagen. Esto permitirá que sea más sencillo operar con esos elementos en 
posteriores operaciones. La segmentación simplifica los elementos de la imagen, 
y la imagen resultante tiene menor complejidad pero resulta más útil a la hora 
de realizar tales operaciones. 

La figura 16.4 nos muestra el resultado de una operación de segmentación 
aplicada sobre una imagen base (en este caso se trata de una ortofoto en blanco 
y negro). En los sucesivos apartados se empleará esta misma imagen original para 
ilustrar cada procedimiento. La curva de transformación asociada, con un umbral 
aplicado de 173, se muestra en la figura 16.5. 



Figura 16.4: Imagen original (a) y resultado de un proceso de segmentación (b) 


255 


o l - 

0 173 255 

Figura 16.5: Curva de transformación asociada a una segmentación por umbral. 

Como vemos, la función de transformación simplemente establece un valor 
umbral, a partir del cual se asocia el valor 255, mientras que por debajo se asocia 
el valor 0 (es habitual también emplear los valores 1 y 0 en lugar de los anteriores) . 
Suponemos en este caso que los valores que resultan de interés y queremos aislar son 
aquellos que presentan valores superiores al umbral, mientras que todos los restantes 
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los consideramos parte del fondo. La operación puede realizarse también al contra- 
rio, en caso de que los objetos a separar vengan caracterizados por valores bajos. 
En este caso, se asignaría 255 a los valores por debajo del umbral y 0 a los restantes. 

La selección del umbral es el elemento clave en esta forma de segmentación, y 
condiciona el resultado del procedimiento. El umbral puede seleccionarse en base a 
las propias características de la imagen, o bien a partir de un conocimiento previo 
de las características de los objetos a definir. En el primer caso, el histograma de la 
imagen se convierte en una herramienta base para definir el umbral correctamente. 

Además de establecerlo de forma directa mediante un valor concreto, existen 
diversas formulaciones que permiten fijar un umbral de forma automática, siendo 
formulaciones adaptativas. De igual modo, este umbral puede no ser constante 
para toda la imagen, y realizarse una segmentación por zonas, de tal modo que 
no se emplee el mismo umbral en todas ellas. Esto puede mejorar la eficacia del 
proceso, ya que la relación entre el fondo y los objetos a separar no ha de ser la 
misma en todas las áreas de la imagen. 

En [272] se describen formulaciones alternativas para esta definición automática 
de umbrales. 

Este tipo de segmentación es, como se ha dicho, la forma más sencilla de esta cla- 
se de procesos, ya que la imagen de partida es una imagen en escala de grises (imagen 
de una banda), y el resultado es una imagen binaria. Se pueden, no obstante, seg- 
mentar imágenes multibanda y hacerlo no en dos partes (fondo y elemento), sino en 
un número mayor de ellos (fondo y distintos elementos, codificados con distintos va- 
lores) , entrañando las formulaciones correspondientes una complejidad lógicamente 
mayor. Existen, por tanto, otros métodos de segmentación, muchos de los cuales no 
implican únicamente operaciones píxel a píxel, sino más complejas. Aunque no en- 
traremos a detallarlas con tanta profundidad, se enumeran y describen brevemente 
a continuación las principales familias en que podemos dividir dichos métodos [273] : 

■ Segmentación basada en umbral. Del tipo de los que hemos visto hasta 
el momento. 

■ Segmentación basada en regiones. Se ha de proporcionar al algoritmo 
una serie de puntos que definan las distintas regiones, tales como puntos 
centrales de las mismas. A partir de ellos, se va ampliando el espacio ocupado 
por cada región (de un único punto) en función de la homogeneidad de las 
celdas circundantes 2 . 

■ Segmentación basada en agregación. Métodos iterativos que agrupan 
los píxeles en grupos de forma que estas agrupaciones sean lo más homogé- 

2 Es probable que el lector haya utilizado alguna vez algún programa de tratamiento de imágenes, 
en cuyo caso podrá entender de forma sencilla la forma de proceder de estos algoritmos, asimilándolo 
a la herramienta «varita mágica», que selecciona los píxeles contiguos y de un color similar a uno 
seleccionado sobre la imagen. En este caso, los puntos originales se le proporcionan al algoritmo, 
que a partir de ellos efectúa un procedimiento similar al de dicha «varita mágica», seleccionando 
progresivamente los píxeles «parecidos» situados alrededor, haciendo crecer cada región. 
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neas posibles. Estos algoritmos no los vamos a tratar en esta sección, pero 
sí que se describen en otro punto de este texto, dentro de la sección 20.2.2 
dedicada a la clasificación no supervisada. 

Para el lector interesado, en [274] o [271] pueden encontrarse tratados en 
profundidad todos estos distintos grupos de metodologías. 

Desde el punto de vista de las operaciones del álgebra de mapas que conocemos, 
la segmentación es una reclasificación de valores lo más sencilla posible, ya que 
únicamente se crean dos clases (la de valores por debajo del umbral y la de valores por 
encima de él). Un proceso algo más complejo es la definición de varios umbrales, de 
forma que aparezcan más clases, siendo este también equivalente a la reclasificación 
según la vimos en su momento. No obstante, en el ámbito del análisis de imágenes 
esta operación se conoce habitualmente con el nombre de Density slicing. 

Expansión de contraste 

Puesto que muchos de los procedimientos de este apartado están, como se 
ha dicho, principalmente encaminados a la mejora visual de la imagen y que 
esta aporte más información a la hora de su visualización, la mejor manera de 
comprender uno de ellos es ver un ejemplo práctico, igual que hicimos en el caso de 
la segmentación. Para el caso de la expansión de contraste, la figura 16.6 muestra 
el resultado de aplicar este procedimiento sobre la imagen base ya presentada. 



Figura 16.6: Imagen tras un proceso de expansión de contraste 

Como puede apreciarse si se compara con la imagen original, el proceso de expan- 
sión de contraste (también conocido como normalización ) aporta mayor definición 
a los distintos elementos de la imagen. Esto es así porque la expansión del contraste 
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modifica el histograma de tal forma que todos los valores posibles de los Niveles 
Digitales sean empleados. Es decir, que de los 255 niveles de intensidad de gris el his- 
tograma abarque todos ellos, y al traducirse eso en las tonalidades de gris a la hora de 
representarse, estas también vayan desde el valor 0 (negro) hasta el 255(blanco). Lo- 
grando esto, se obtiene la mayor definición visual que puede apreciarse en la imagen. 

Este efecto se consigue escalando el histograma, «estirándolo» horizontalmente 
para que cubra todo el rango de valores. En imágenes cuyos Niveles Digitales 
se sitúan mayoritariamente en un intervalo reducido, la representación presenta 
tonalidades homogéneas que no aprovechan todo el contraste que puede lograrse 
con el rango completo de intensidades. Aplicando una transformación conveniente, 
se consigue que el histograma gane amplitud y la imagen gane en contraste. 

A partir de una imagen con sus valores mínimo (x) y máximo(A) respectivos, se 
trata de obtener una imagen que mantenga una distribución similar en su histogra- 
ma, pero de tal forma que los valores mínimo y máximo pasen a ser otros distintos, 
en particular 0 y 255 como valores límites del rango habitual de Niveles Digitales. 
Para lograr esto la forma más simple es aplicar una fórmula como la siguiente. 

. 255 (ND—x) . 

ND = A- (16.3.2 

X—x 

donde ND es el Nivel Digital de la imagen original y ND' el de la imagen resultante. 

Si recordamos lo visto en el apartado 14.2.1, la normalización era una función 
de tipo local dentro del álgebra de mapas, y respondía a una expresión similar a 
la anterior. El fundamento en este caso es el mismo, aunque la finalidad sea aquí 
la de mejorar la imagen de cara a su visualización. 

En el tratamiento de imágenes es habitual no aplicar directamente la expresión 
16.3.2 con los valores mínimo y máximo absolutos de la imagen. De hacerlo así, la 
presencia de valores atípicos alejados de la media (píxeles muy o muy poco brillantes) 
puede desvirtuar el rango en el que se sitúan realmente los Niveles Digitales de 
la imagen, y no conseguirse mediante la expansión de contraste el efecto deseado. 

Una solución es acudir al histograma y tomar como valores de x y X no los 
extremos absolutos, sino los correspondientes a los percentiles del 5% y el 95%. Al 
operar con estos valores límite, aparecerán valores resultantes fuera del rango de 
destino (0-255 en el caso más habitual que citamos), que se igualan a los valores 
mínimo o máximo de dicho rango en función de si se encuentran fuera por el lado 
negativo o el positivo. 

Otra solución frecuente para la selección de x y X consiste en tomar la frecuencia 
del pico del histograma (es decir, el número del píxel que representa el valor máximo 
de este), y definir un umbral utilizando un porcentaje de dicha frecuencia. El valor 
mínimo x corresponde al valor del primer Nivel Digital que, empezando desde 0 y en 
sentido creciente (de izquierda a derecha del histograma) , supera dicha frecuencia. 
De modo similar, el valor máximo X se calcula recorriendo el histograma en sentido 
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negativo (de derecha a izquierda) y tomando el primer Nivel Digital cuya banda 
de frecuencia en el histograma sea superior a la establecida por el umbral. 

Si se aplica la normalización a una imagen multibanda, es importante tener 
en cuenta que las relaciones entre los Niveles Digitales de estas han de preservarse. 
Cuando se aplica normalización sobre un conjunto de capas ráster, el objetivo 
es escalar las distintas variables para que ocupen un rango homogéneo, y esta 
relación no es relevante. En el caso de imágenes, y trabajando con bandas en lugar 
de capas, sí lo es, ya que de ella dependen, por ejemplo, los colores obtenidos al 
componerlas para formar imágenes en falso color según veremos más adelante. 

Modificación de brillo y contraste 

Tanto el brillo como el contraste pueden modificarse mediante funciones lineales 
sencillas, tal como puede verse en la imagen 16.7. 



Figura 16.7: Imagen original y modificación del brillo y el contraste, junto con sus curvas 
de transformación asociadas 

Suponiendo como es habitual que trabajamos en un rango de valores entre 0 
y 255, la modificación del brillo se lleva a cabo con una función de la forma 

ND' = ND+c ; cE [0,255]. (16.3.3) 

Valores positivos de la constante c aclaran la imagen, mientras que los negativos 
la oscurecen. 

Para el caso del contraste, las funciones son de la forma 


ND' = mND+c 


(16.3.4) 
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El valor de c se calcula a partir del de m, según 


c= 


1 — m 
2 


(16.3.5) 


Valores altos de la pendiente y puntos de corte negativos dan lugar a imágenes 
de alto contraste, mientras que valores bajos de pendiente y puntos de corte 
positivos producen imágenes de bajo contraste. 

El caso de la expansión de contraste es un caso particular de este tipo de 
transformaciones lineales, que no obstante se ha analizado aparte por sus par- 
ticularidades y por ser una operación muy frecuente. En concreto, la expansión 
de contraste es una operación que maximiza el contraste pero sin producir satu- 
ración en los tonos extremos (blancos y negros) . La función de transformación 
correspondiente se representa en la figura 16.8. 



Figura 16.8: Curva de transformación correspondiente a una expansión de contraste 

El empleo de funciones no lineales permite mayor flexibilidad a la hora de mejo- 
rar el contraste, al tiempo que se evita la aparición de saturación en los extremos del 
rango de valores. Una de las funciones más habituales en este caso es la siguiente: 

ND' = ND a (16.3.6) 

Esta operación se conoce como corrección de gamma , y es habitual en el 
tratamiento de imágenes. 

Las funciones sigmoidales como la mostrada a continuación también son una 
alternativa frecuente. 


ND' = 


1 

l_|_ e aND+p 


(16.3.7) 
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Ecualización 

La ecualización es un proceso similar a la normalización, en cuanto que hace 
más patentes las diferencias entre los distintos niveles de la imagen, añadiendo 
definición a esta. El proceso de ecualización modifica el histograma de tal modo 
que en la nueva imagen todos los niveles digitales tengan la misma frecuencia. De 
esta forma, se redistribuyen los valores de intensidad a lo largo de todo el espectro, 
igualando la presencia de estos en la imagen. 

La figura 16.9 muestra la comparación entre la imagen original y la ecualizada, 
así como sus histogramas acumulados. Esto permite ver más claramente la natu- 
raleza de la transformación. Teóricamente, si el histograma es constante tras la 
ecualización, el histograma acumulado debería ser una recta inclinada. El hecho de 
trabajar con valores discretos de los Niveles Digitales hace que no sea exactamente 
así, aunque puede claramente verse que la forma sí se asemeja a una recta en lugar 
de a la curva sigmoidal que presenta el histograma de la imagen original. 



Figura 16.9: a) Imagen e histograma acumulado originales, b) imagen e histograma 
acumulado tras un proceso de ecualización. 

La función de trasformación deriva del propio histograma acumulado original, 
teniendo su misma forma. De este modo, se hace innecesario el elegir valores 
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umbral sobre el propio histograma, tal como sucedía en el caso de la expansión de 
contraste. Para un píxel con un Nivel Digital ND en la imagen original, se tiene 
un valor en la imagen ecualizada dado por la expresión 

255 

ND' = T(ND)— (16.3.8) 

siendo N el número total de píxeles de la imagen y T(x) la función que define 
el histograma acumulado, es decir, el número de píxeles de la imagen con Nivel 
Digital menor que x. 

Al trabajar con imágenes de varias bandas, deben tenerse en cuenta los mismos 
aspectos ya comentados para la expansión de contraste, en relación a la relación 
entre las distintas bandas. En [275] pueden encontrarse detalles sobre ecualización 
de imágenes en color. 

16.3.2. Filtros 

Al igual que algunas de las operaciones vistas ya en este capítulo, los filtros son 
similares en concepto a parte de las operaciones que ya conocemos de capítulos 
anteriores. En particular, comparten sus fundamentos con las funciones focales del 
álgebra de mapas, aunque, al igual que en otros de los casos anteriores, la utilización 
de estas tiene aquí una función principalmente relacionada con la mejora visual. 

Podemos dividir los filtros en dos tipos en función del tipo de modificación que 
realizan. 

■ Filtros de suavizado. Producen un efecto de desenfoque, restando definición 
a la imagen. Atenúan las diferencias entre píxeles vecinos. 

■ Filtros de realce: Producen un efecto de enfoque, aumentando la definición 
de la imagen. Acentúan las diferencias de intensidad entre píxeles vecinos. 

Ciertos filtros calculan los nuevos valores como combinaciones lineales de 
los píxeles del entorno. Son las denominadas convoluciones, las cuales ya vimos 
en el capítulo dedicado al álgebra de mapas. La convolución se define mediante 
una matriz nxn (que denominábamos núcleo ) y esta permite calcular el valor 
resultante de la operación. En función de los valores de la matriz, el efecto que 
el filtro tenga sobre la imagen será uno u otro. 

Otros filtros, a diferencia de las convoluciones, se basan en funciones estadísticas 
que no pueden expresarse mediante un núcleo. 

Filtros de suavizado 

Como muestra la figura 16.10, los filtros de suavizado (también conocidos 
como filtros de paso bajo ) provocan una perdida de foco en la imagen. Este efecto 
se consigue disminuyendo las diferencias entre píxeles contiguos, algo que puede 
obtenerse por ejemplo mediante un filtro de media. Como ya vimos, este puede 
expresarse mediante un núcleo como el siguiente: 
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1 

1 

1 

1 

1 

1 

1 

1 

1 


El efecto del filtro de media vimos que, aplicado sobre una capa de elevación, 
«redondeaba» el relieve. En el caso de ser aplicado sobre una imagen hace que esta 
aparezca más borrosa. La cantidad de suavizado puede ser controlada, al igual 
que en el caso de aplicarse sobre otro tipo de capas ráster, mediante el tamaño 
de la ventana, que puede ser mayor que el habitual 3x3 anterior. 

Otra forma de modificar el efecto del suavizado, en este caso limitándolo, es 
dando más peso al píxel central. Para ello puede emplearse un núcleo como el 
mostrado a continuación: 


1 

1 

1 

1 

2 

1 

1 

1 

1 


La media es sensible a los valores extremos de la ventana, por lo que una opción 
habitual es sustituir el filtro de media por uno de mediana. Este no es sensible a 
la presencia de valores extremos muy alejados de la media ( outliers ), y además 
garantiza que el valor resultante es un valor que existe como tal en la ventana de 
píxeles circundantes, lo cual puede resultar de interés en algunas circunstancias. 

El filtro de mediana no es una convolución, y no puede por tanto expresarse 
mediante un núcleo como sucedía con el de media. 

La aplicación de un filtro de suavizado no solo tiene como efecto el desenfoque 
de la imagen, sino que también elimina el ruido de la misma. Por ello, estos filtros 
son una buena herramienta para tratar algunas de las deficiencias de las imágenes, 
que como vimos pueden presentar píxeles con Niveles Digitales muy distintos de 
los de su entorno. 

En la figura 16.11 puede observarse como la presencia de una línea errónea 
introducida en una imagen se corrige parcialmente con un filtro de mediana. 

Filtros como el de mayoría o moda, que da como valor resultante de la celda 
aquel que se repite más entre las celdas circundantes, pueden también aplicarse 
para estos fines. 

Las convoluciones tales como el filtro de media no son recomendables en mu- 
chos de estos casos, según sea el tipo de ruido que deseamos eliminar. Un tipo 
de ruido habitual es la presencia de píxeles blancos o negros debidos a errores de 
transmisión o almacenamiento, es decir, con Niveles Digitales extremos. El sesgo 
que introducen estos píxeles es muy alto, y la aplicación de un filtro de media no 
es válido para eliminar esta clase de ruido. 
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Figura 16.10: Imagen tras la aplicación de un filtro de suavizado 



Figura 16.11: Eliminación de una línea errónea por aplicación de un filtro de mediana 



Otro tipo de ruido habitual es el conocido como sal y pimienta, que aparece fre- 
cuentemente al segmentar imágenes según vimos en un punto anterior. La imagen de 
salida contiene únicamente valores 1 y 0, representados de la forma habitual en blan- 
co y negro respectivamente. Es normal que en la segmentación aparezcan píxeles 
con uno de dichos valores, rodeados por pixeles del otro, es decir píxeles completa- 
mente aislados. Esto da la sensación de una imagen sobre la que se han «esparcido» 
píxeles blancos (sal) sobre la parte negra, o negros (pimienta) sobre la parte blanca. 

Para limpiar estas imágenes resultantes, se emplean también filtros como 
los anteriores. Un filtro de mediana aplicado sobre la imagen de la figura 16.4 
(resultado de una segmentación) elimina gran parte de los píxeles aislados y genera 
el resultado mostrado en la figura 16.12. 


436 


Sistemas de Información Geográfica 



Figura 16.12: Eliminación de ruido de tipo sal y pimienta mediante filtro de mediana. 


Filtros de realce 

Los filtros de realce (o de paso alto ) tienen el efecto justamente contrario al de 
los anteriores, ya que acentúan las diferencias entre píxeles adyacentes, teniendo 
un efecto de enfoque. La definición aumenta, como puede verse en la imagen 16.13. 
Si se compara con la imagen original, se aprecia una separación más clara entre 
las tonalidades de píxeles contiguos, cuya diferencia se acentúa. 



Figura 16.13: Imagen tras la aplicación de un filtro de realce 
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Para obtener un filtro de realce, puede partirse de uno de suavizado, ya que 
una forma de realzar las diferencias entre píxeles es emplear un filtro de paso bajo 
para obtener una imagen suavizada, y después restar esta imagen de la imagen 
original. Haciendo esto se elimina el valor medio y se deja en cada píxel el valor 
que refleja la variación local de los Niveles Digitales. 

El núcleo que caracteriza esta transformación puede obtenerse realizando 
el mismo calculo sobre los núcleos de las operaciones independientes. Es decir, 
restando al núcleo identidad el de media, obteniendo el siguiente: 


-1 

-1 

-1 

-1 

8 

-1 

-1 

-1 

-1 


Filtros de detección de bordes 

Con un fundamento similar a los anteriores, los filtros de detección de bordes 
permiten localizar las zonas donde se producen transiciones bruscas de intensidad. 
Aplicado esto al análisis de imágenes en un contexto geográfico, puede emplearse 
este tipo de filtros como herramientas para identificar zonas y fronteras entre 
distintas formaciones de una área de estudio. 

Un operador habitual para la detección de bordes es el denominado filtro 
Laplaciano , el cual puede expresarse mediante un núcleo de la forma 


0 

-1 

0 

-1 

4 

-1 

0 

-1 

0 


Para hacer su expresión más sencilla, tanto este núcleo como los siguientes no 
se aplican según la ecuación 16.3.9, sino según la siguiente: 

n 

y = ^2,Ziki ; fc¿Gl (16.3.9) 

Í = 1 

Es decir, sin dividir el valor resultante entre la suma de los coeficientes. 

En la figura 16.14 puede verse el efecto de un filtro Laplaciano tiene sobre dos 
imágenes. En la imagen a), se ha aplicado sobre la imagen de ejemplo original. 
En el caso b) se ha empleado como imagen base la imagen ecualizada. Como 
puede apreciarse, la ecualización realza el efecto del filtro de detección de bordes, 
haciendo más patentes los resultados. Además de una mejora visual, la ecualización 
implica en este caso una mejora de los resultados derivados. 
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Para mostrar más claramente el resultado de estos filtros, se ha escogido una 
región de la imagen (en la parte superior izquierda) en lugar de la imagen completa, 
por contener un mayor número de entidades lineales. Como puede apreciarse, es 
en la detección de estos elementos lineales donde mejor actúan estos filtros. 



Figura 16.14: Aplicación de un filtro de detección de bordes sobre la imagen original 
(a) y la imagen ecualizada (b) . 

El filtro Laplaciano tiene su base en el análisis de las segundas derivadas de 
la función que los Niveles Digitales definen y la detección de puntos donde esta 
se anule. Otros filtros se basan en el estudio del gradiente (la primera derivada) 
de forma que se realcen las zonas en las que existan variaciones notables entre las 
intensidades de píxeles contiguos. 

Aplicando filtros de esta segunda clase, la detección de bordes puede hacerse 
restringida a una dirección predominante, tal como la vertical (detectando varia- 
ciones entre filas) o la horizontal (detectando variaciones entre columnas). Por 
ejemplo, con los filtros siguientes, conocidos como filtros de Sobel , cada uno de 
ellos correspondiente a una de las direcciones anteriores. 


1 

2 

1 

0 

0 

0 

-1 

-2 

-1 


-1 

0 

1 

-2 

0 

2 

-1 

0 

1 


El resultado de aplicar estos filtros puede verse en la figura 16.15. 

Otros filtros habituales son los siguientes, denominados filtros de Prewitt, 


1 

1 

1 

0 

0 

0 

-1 

-1 

-1 


-1 

0 

1 

-1 

0 

1 

-1 

0 

1 
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Figura 16.15: Aplicación de un filtro de Sobel vertical (a) y horizontal (b). 


Las variantes de estos filtros en las direcciones indicadas pueden combinarse 
en un filtro global según la expresión 


y=\Jyl+yl (16.3.10) 

donde y\ y y 2 son los valores resultantes de la aplicación de los filtros horizontal 
y vertical respectivamente. 

El fundamento de este cálculo es similar a lo visto en 15.5.1 para el caso de 
la pendiente calculada sobre un MDE. 

Con respecto al filtro Laplaciano, los filtros basados en derivadas direccionales 
tienen como desventaja una mayor sensibilidad al ruido presente en la imagen. 

La relación entre los filtros de detección de bordes y los de realce puede verse 
en el siguiente ejemplo. Si se toma un filtro Laplaciano y se le añade un filtro 
identidad (es decir, a la imagen resultante se le suma la imagen original), tenemos 
el filtro mostrado a continuación. 


0 

-1 

0 

-1 

5 

-1 

0 

-1 

0 


Aplicando este filtro se obtiene una imagen que mantiene un aspecto similar 
a la imagen original, pero con mayor definición. Es decir, el mismo efecto que si 
se aplicara un filtro de realce. 




440 


Sistemas de Información Geográfica 


16.3.3. Fusión de imágenes 

La fusión de imágenes engloba a una serie de procesos que permiten integrar la 
información procedente de varias fuentes de datos distintas en una única imagen. 
Esta imagen resultante facilita la interpretación y análisis de la información de 
partida, englobando las características más destacables de las imágenes originales. 

Por medio de la fusión pueden crearse imágenes sintéticas que combinen imá- 
genes con alta resolución espacial y otras con alta resolución espectral, y que 
presenten alta resolución en ambas componentes. Esta operación es muy útil 
teniendo en cuenta que existen sensores con gran precisión espectral pero que no 
se caracterizan por una elevada definición (no dan imágenes con tamaños de píxel 
bajos), mientras que en otros sucede justamente lo contrario. Unir estas mediante 
un proceso de fusión es una forma de obtener imágenes de mejor calidad con las 
que lograr mejores resultados. 

El uso combinado de imágenes pancromáticas e imágenes multiespectrales 
como las del satélite LANDSAT es una práctica habitual a la hora de aplicar este 
método de fusión. 

Veremos tres métodos principales. 

- IHS 

■ Por Componentes Principales 

■ Brovey 

Transformación IHS 

La imagen que dispone de una mejor información espectral aporta esta de 
forma habitual en el modo RGB que ya conocemos. Este, recordemos, implica 
tres bandas correspondientes a los colores rojo, verde y azul, las cuales dan, por 
adición, la imagen en color resultante. 

El modo RGB es solo uno de los muchos existentes para codificar un color, 
siendo el más frecuente para el registro de imágenes y la representación de estas en 
una pantalla, pero no el único. A la hora de llevar a cabo una fusión de imágenes, 
la utilización de otros formatos resulta más ventajosa. 

Uno de los modo que pueden emplearse para este fin es el conocido como IHS 3 . 
Este formato es más similar a cómo percibimos los distintos colores, y se basa en 
los tres siguientes componentes [276]: 

■ Intensidad (I). Expresa el brillo del color. Es la variable que se percibe 
más sencillamente por parte del ojo humano. 

- Tono (H) . Expresa de qué color se trata. Más exactamente, indica la longitud 
de onda predominante de dicho color. 

■ Saturación (S). Expresa la pureza del color. Valores altos indican una alta 
presencia de blanco. 

hntensity, Hue, Saturation (Intensidad, Tono, Saturación) 
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Para saber más acerca del espacio de color IHS y las formas de convertir entre 
RGB y IHS, y viceversa, puede consultarse [277]. Veremos algo más sobre estos 
conceptos, aunque en un contexto distinto, en el capítulo 26. 

Dadas dos imágenes RGB, una de ellas con mayor información espacial y 
otra con mayor información espectral, puede realizarse una fusión empleando una 
transformación IHS siguiendo los pasos descritos a continuación [278] [279]: 

■ Se remuestrea la imagen de menor resolución espacial a las dimensiones de 
la de mayor resolución, o bien ambas a un tamaño de píxel intermedio entre 
los de ambas imágenes. Ese será el tamaño de píxel de la imagen resultante, 
mejorando así el de la imagen que aporta la información espectral. 

■ Se convierten las imágenes al formato IHS. Lo habitual es que la imagen con 
mayor resolución espacial sea de una única banda, con lo que no es necesaria 
conversión alguna. 

■ Se sustituye en la imagen con la información espectral la banda de intensidad 
I por la banda de intensidad de la otra imagen. 

■ Se aplica una transformación inversa para pasar de nuevo al formato RGB. 

En la figura 16.16 puede verse un esquema del proceso de fusión de imágenes 

según lo descrito anteriormente. 



Figura 16.16: Fusión de imágenes mediante transformación IHS 


Transformación por componentes principales 

El método de análisis de componentes principales es una técnica estadística 
cuyos detalles veremos más adelante dentro del apartado 20.5. En esencia, se trata 
de un método que convierte un conjunto de capas (o bandas) intercorrelacionadas 
en uno nuevo con un menor número de capas, y menos correlacionadas. Es decir, 
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sustituye las variables originales por otras entre las que no existe correlación, cada 
una de las cuales explica un porcentaje concreto de la varianza global. 

Puede aprovecharse el análisis de componentes principales para efectuar una 
fusión de imágenes, siguiendo un proceso similar al de la transformación IHS, con 
los pasos enunciados a continuación. 

■ Se remuestrean las imágenes a un marco común como ya vimos anteriormente 

■ Se efectúa un análisis de componentes principales en ambas imágenes. 

■ El componente principal (la nueva banda que explica un mayor porcentaje) 
de la imagen con la información espectral, se sustituye por el componente 
principal de la imagen de mejor resolución espacial. 

■ Se aplica un proceso inverso al análisis de componentes principales sobre 
dicha imagen de información espectral, obteniendo así el resultado buscado. 

Transformación de Brovey 

La transformación de Brovey [280] se emplea también para la fusión de imáge- 
nes, aunque su procedimiento es bien distinto a los anteriores. En este caso, no se 
da una modificación previa del conjunto de capas que conforman la componente 
multiespectral, seguida esta de una sustitución, sino que se opera banda a banda, 
aumentando la resolución de estas de forma individual. Combinando las bandas 
resultantes se obtiene la imagen sintética buscada. 

En particular, se parte de una imagen con tres bandas y una imagen pancro- 
mática de mayor resolución espacial. Para transformar la banda i-ésima se utiliza 
la siguiente expresión: 


ND' = 


NDi 

ND 1 +ND 2 +ND 3 


ND 


pan 


(16.3.11) 


donde ND n es el Nivel Digital del píxel en la banda n-ésima, y ND pan el de dicho 
píxel en la imagen pancromática. Obviamente, se requieren remuestreos para 
ajustar las capas a un marco común donde exista correspondencia de píxeles entre 
ambas imágenes. 

Para el caso de los sensores más habituales existen recomendaciones sobre qué 
tres bandas tomar para definir la imagen multiespectral requerida por el método. 
Por ejemplo, para el sensor LANDSAT se recomiendan las bandas 2, 4 y 5; y para 
Quickbird las bandas del verde, rojo e infrarrojo cercano. 


16.4. Análisis y extracción de información 

Con las imágenes ya preparadas y tratadas con objeto de «exponer» en la 
mayor medida posible la información que contienen, puede procederse a su análisis. 
El fin de este análisis puede ser la delineación e identificación de ciertos elementos 
(masas de agua, formaciones rocosas, construcciones, etc.), o bien la caracterización 
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de las distintas áreas del terreno (tipo de uso de suelo, condiciones fisico-químicas, 
etc.), existiendo para cada uno de estos propósitos una serie de algoritmos y 
formulaciones. 

16.4.1. Visualización 

La obtención de de resultados a partir de imágenes, tales como la clasificación 
de las distintas zonas o la localización de áreas en en las que aparece algún ele- 
mento particular del terreno (por ejemplo, zonas de agua como ríos o embalses), 
se realiza, como veremos más adelante, a partir de los Niveles Digitales de las 
distintas bandas de una imagen. Este análisis es de tipo puramente numérico. No 
obstante, la conversión de esos Niveles Digitales en colores permite extraer los 
mismos resultados en base a la mera exploración visual, ya que presenta los valores 
de las bandas de un modo en que el ojo humano puede interpretarlos y analizarlos. 
Así, el análisis más inmediato que puede realizarse con una imagen es el de tipo 
visual, siempre que se tenga una representación adecuada de la imagen. 

Las imágenes más sencillas contienen una única banda, y su representación en 
blanco y negro (escala de grises) es la forma habitual de mostrarlas. Las imágenes 
digitales habituales se dividen en tres bandas, denominadas canales, cada una de las 
cuales contiene la información sobre un color concreto. En el caso más frecuente del 
modelo RGB, ya conocido por nosotros, estos colores son el rojo, el verde y el azul. 

Las imágenes que tomamos con una cámara digital o una fotografía aérea en 
color escaneada y almacenada en un fichero, ambas utilizan este modelo de colores. 
Los periféricos de representación en los cuales las observamos, tales como una 
pantalla o un cañón de proyección, utilizan un esquema igual para reproducir 
un color dado. Este esquema se denomina de tipo aditivo, ya que forma el color 
sumando unas intensidades concretas de cada uno de los colores básicos. La figura 
16.17 muestra un ejemplo de descomposición en canales RGB. 

Según lo anterior, el color verde de, por ejemplo, una zona de vegetación, se des- 
compone en una cierta intensidad de verde, una de rojo y una de azul, se almacena, 
y después se recrea en el monitor de un ordenador sumando dichas intensidades. 
Es decir, existe una relación directa entre el color real y el que vemos en pantalla. 

A diferencia de esto, las imágenes de satélite multiespectrales presentan algunas 
diferencias en cuanto a su significado visual, pero es interesante buscar de igual 
modo una forma de visualizarlas para poder llevar a cabo este primer análisis. 
Los Niveles Digitales de las distintas bandas no están relacionados con uno de 
los colores base de ningún modelo. Como sabemos, representan las intensidades 
correspondientes a una longitud de onda concreta, pero esta no tiene por qué ser 
la de un color básico o existir un modelo que se base en dichos colores. De hecho, ni 
siquiera tiene que corresponder a una longitud de onda dentro del espectro visible, 
ya que puede corresponder al infrarrojo, por ejemplo. Asimismo, el número de 
bandas no ha de ser necesariamente de tres, y puede ser muy superior. 
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Figura 16.17: Descomposición de una imagen en color en sus componentes RGB. 

En estos casos, se toman tres bandas de entre las que componen la imagen, y 
se asocian estas a uno u otro de los canales del rojo, el verde y el azul. En función 
de las bandas y el esquema de asignación que se tome, la representación visual que 
se obtiene es muy distinta, y más o menos válida para uno u otro tipo de análisis. 

De entre los posibles subconjuntos de tres bandas y el orden de asignación de las 
mismas, algunos presentan una mayor lógica de cara a la realización de los análisis 
más frecuentes. Así, resulta fácil pensar que la opción más interesante es tratar de se- 
leccionar aquellas tres bandas cuyas longitudes de onda sean más similares a las del 
rojo, el verde y el azul, de tal modo que la composición resultante sea lo más similar 
posible a la tonalidad real del terreno fotografiado. Para imágenes del sensor LAND- 
SAT TM, por ejemplo, esto lleva a emplear las bandas 3 (rojo), 2 (verde) y 1 (azul). 

En otros casos, no existen tales bandas, y puede o bien tomarse una banda 
alternativa, o proceder a efectuar combinaciones lineales de las bandas existentes. 
En este ultimo caso, se simula la banda que no está presente. Por ejemplo, en el 
caso del sensor SPOT XS pueden obtenerse los valores de intensidad de cada canal 
según las siguientes expresiones: 


Rojo= Banda2 (16.4.1) 

Vcvdc ~ BandcLS+Bandíil 
Azul = Bandal 


El cociente entre dos bandas dadas es también una solución habitual a utilizar 
para obtener los valores para los distintos canales. 
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Si se toman otras bandas distintas y se las asocia a un canal dado (pese a que 
realmente no contienen información acerca de la intensidad en la longitud de onda 
de dicho color) , se obtiene lo que se conoce como composiciones en falso color. 

Una composición en falso color habitual es la que utiliza la banda del infrarrojo 
cercano para el canal rojo, la del rojo para el canal azul y la del verde para el canal 
azul. El resultado es similar a de una fotografía infrarroja, y su interpretación en 
función de los distintos colores pude hacerse de la misma forma que en esta. Para 
el sensor LANDSAT TM, las bandas 4,2,1 o bien las bandas 3,2,1 son las que se 
deben usar para generar esta composición. 

En general, pueden tomarse cualesquiera bandas para crear una composición 
en falso color. La elección de unas u otras y el canal al que se asocian debe estar 
en relación con la finalidad que se persiga, de forma que la composición resultante 
realce las características de mayor interés para la interpretación visual de la imagen. 
Como veremos más adelante en este capítulo, la actividad de la vegetación afecta 
notablemente a los valores en el rango del infrarrojo, y son estos valores los que se 
utilizarán para los análisis relativos a dicha vegetación. Este mismo concepto puede 
aplicarse a la hora de la visualización, y si queremos discriminar la vegetación 
existente con un análisis puramente visual, será de interés incorporar la banda 
correspondiente a dicha longitud de onda al crear la composición en falso color, 
ya que aportará información a tal fin. 

La figura 16.18 muestra distintas composiciones a partir de las bandas de una 
imagen LANDSAT TM. 



Figura 16.18: Distintas composiciones a partir de las bandas de una imagen LANDSAT 
TM. a) 1, 2, 5; b) 2, 4, 3; c) 2, 5, 3 

16.4.2. Operaciones morfológicas 

Las operaciones morfológicas producen modificaciones de las formas presentes 
en la imagen, siendo estas formas las de los distintos elementos que encontramos 
en dicha imagen. En su concepción básica, estas operaciones se aplican sobre 
imágenes binarias (recordemos que estas pueden generarse en base a otro tipo de 
imágenes mediante las formulaciones vistas en la sección 16.3.1), las cuales, según 
vimos, contienen únicamente dos valores: uno de ellos que representa los citados 
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elementos y otro que representa el fondo de la imagen. De esta forma, es sencillo 
entender a qué nos referimos cuando hablamos de las formas que aparecen en la 
imagen, que son las que se van a ver afectadas por las operaciones de esta sección. 
Esto puede entenderse recurriendo a la figura 16.19, que será la que utilicemos 
como base para estudiar las operaciones morfológicas a lo largo de esta sección. 



Figura 16.19: Una sencilla imagen binaria. Para más claridad, se han trazado líneas 
divisorias entre los distintos píxeles. 

Las operaciones morfológicas se aplican originalmente sobre imágenes binarias, 
pero existen igualmente versiones de los algoritmos correspondientes que pueden 
aplicarse sobre imágenes en escala de grises o incluso imágenes multibanda. A la ho- 
ra de emplearlas dentro de un SIG, podemos aplicar este tipo de operaciones sobre 
cualquier capa ráster que contenga de algún modo formas como las que hemos citado 
y pueden observarse en la anterior imagen. Tales capas pueden obtenerse como resul- 
tado de muchas de las operaciones que hemos visto en capítulos anteriores, y pueden 
también prepararse empleando algunos de los procedimientos presentados dentro 
de este mismo, tales como la detección de bordes. También, por supuesto, pueden ser 
imágenes más complejas que contengan este tipo de elementos, tales como las distin- 
tas zonas de cultivo de una zona dada, aunque estas requieren preparación o proce- 
sos previos. La Clasificación, que veremos en la sección 20.2, es uno de tales procesos. 

La importancia de estas funciones reside en que sirven para alterar los elementos 
de la imagen, siendo útiles para que otras operaciones posteriores se desarrollen de 
una forma más adecuada. Algunos de estos procesos posteriores que se benefician 
de la aplicación de operaciones morfológicas son la vectorización (que estudiaremos 
en el apartado 17.2) o la medición de longitudes en caso de elementos lineales. 

Las operaciones morfológicas son sencillas de entender, pero pueden resultar 
complejas en sus planteamientos teóricos, y tienen una fuerte carga matemática, 
especialmente en el caso de no aplicarse sobre imágenes binarias 1 . En este libro 

4 Habitualmente se da un enfoque a este tipo de operaciones basado en teoría de conjuntos. 
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no plantearemos un enfoque tan técnico, y nos centraremos básicamente en las 
capacidades de estas operaciones y la utilidad que presentan para el usuario de 
SIG, sin detallar los pormenores de la base matemática subyacente. Las distintas 
operaciones se explicarán como elementos del álgebra de mapas, más acordes con 
los conocimientos ya desarrollados. Información más extensa sobre estas opera- 
ciones, expresada desde un punto de vista matemático, puede encontrarse en las 
referencias propuestas o textos al uso sobre tratamiento de imágenes digitales 5 . 

De igual modo, veremos las principales operaciones morfológicas aplicadas 
sobre imágenes binarias, centrándonos en la naturaleza de las operaciones en sí 
y su efecto más que en los propios algoritmos. 

Dos son las operaciones morfológicas básicas: 

■ Erosión 

■ Dilatación 

Basadas en estas operaciones, existen otras derivadas, entre las cuales veremos 
tres: 

■ Apertura 

■ Cierre 

■ Esqueletización 

Erosión y dilatación 

Las dos principales operaciones morfológicas son la erosión y la dilatación. 
Pese a que sus nombres son ya sumamente descriptivos, veamos gráficamente en 
la figura 16.20 el efecto de ambas sobre nuestra imagen base. 



Figura 16.20: Resultado de aplicar operaciones de erosión (a) y dilatación (b) sobre 
la imagen base. 

Como es fácil apreciar, la erosión reduce el tamaño de las formas, mientras que 
la dilatación tiene el efecto contrario, «engordándolas» 6 . 

5 Las direcciones Web [281] y [282] contienen información pormenorizada sobre los fundamentos 
en que se basan las operaciones morfológicas, así como una descripción de las más habituales. 

6 Este efecto contrario en realidad hace que las operaciones sean una la dual de la otra. Esto 
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La utilidad de estas operaciones es amplia, no solo por sí mismas sino espe- 
cialmente si consideramos que son la base de otras operaciones que resultan en 
transformaciones de gran interés para ciertos cálculos muy habituales en el trabajo 
con un SIG. 

En ambos casos, partimos de una imagen binaria y de un núcleo o kernel, que 
es una matriz de pequeño tamaño, del mismo modo que ya vimos en el caso de 
las convoluciones ' . Las operaciones que aplicamos en este caso no son de tipo 
algebraico, a diferencia de las convoluciones, sino de tipo lógico, aunque desde 
nuestro punto de vista del álgebra de mapas, estos procesos son parte igualmente 
del grupo de operadores focales. 

Como en muchas operaciones de tipo focal, la ventana más sencilla y habitual 
es la de tamaño 3x3. Por ejemplo, para el caso de la erosión, la siguiente es la 
ventana que utilizaremos. 


1 

1 

1 

1 

1 

1 

1 

1 

1 


Para efectuar dicha erosión desplazamos la ventana por todos los píxeles de 
los elementos que se quieren erosionar (que en una imagen binaria tendrán un 
valor 255 o 1 según hemos visto en el apartado dedicado a la segmentación de 
imágenes) . Si con el anterior núcleo centrado en un píxel concreto todos los píxeles 
circundantes en la imagen coinciden con los valores de la ventana, entonces el píxel 
mantiene su valor 1 como píxel de un elemento. En caso contrario, pasa a tener 
un valor cero, pasando a ser un píxel del fondo. 

El anterior núcleo aplicado según la metodología descrita hace que solo se 
mantengan con valor 1 aquellos píxeles que estén completamente rodeados de otros 
píxeles también de valor 1. Por ello, todos los píxeles del exterior de los distintos 
elementos quedan eliminados (pasan a formar parte del fondo) , y al área de estos 
elementos disminuye. 

El efecto de la erosión es mayor si se utiliza una ventana de mayor tamaño, tal 
como una 5x5, también con valores 1 en todas sus celdas. Este efecto más acusado 
puede reproducirse igualmente si se aplican sucesivos procesos de erosión con la 
ventana menor, reduciendo progresivamente el tamaño de los elementos. 

Para el caso de la dilatación, podemos utilizar el mismo elemento estructural, 
pero el criterio es distinto. En el caso de la erosión se exigía una completa coinci- 
dencia entre la imagen y el elemento estructural. En este, únicamente se exige que 

quiere decir que aplicar una de ellas sobre los elementos de la imagen es equivalente a aplicar 
la otra sobre el fondo 

7 Estos núcleos se denominan también elementos estructurales o sondas dentro de la jerga 
relativa a este tipo de operaciones. 
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al menos uno de los píxeles presente coincidencia. Esta operación, con el núcleo 
presentado, implica que todo píxel que se encuentre en contacto con algún píxel 
del objeto, pasara a formar parte de este. Con ello, los objetos crecen. 


Apertura y cierre 

Combinando las operaciones de erosión y dilatación, se definen otras nuevas. 
Las dos más básicas son la apertura y el cierre. 

La apertura implica realizar una erosión seguida de una dilatación, ambas con 
el mismo elemento estructurante. Este proceso tiene como resultado un suavizado 
de los contornos, así como la eliminación de píxeles aislados. 

Por su parte, el cierre también se componen de erosión y dilatación, pero esta 
vez en orden inverso. Es decir, primero se aplica la dilatación y posteriormente la 
erosión. Igual que antes, ambas operaciones utilizan el mismo elemento estructural. 

La aplicación de una operación de cierre rellena los huecos y concavidades de 
los objetos que son menores en tamaño que el elemento estructural. 

Una aplicación práctica de estas operaciones la podemos encontrar en la imagen 
16.21. En ella la imagen inicial a) presenta una estructura lineal tal como una 
carretera, pero esta, a través de los distintos procesos aplicados para obtener 
la imagen binaria, ha «perdido» algunos píxeles, de forma que ya no existe una 
conexión correcta entre los distintos píxeles que la forman. La carretera ha quedado 
«rota» en fragmentes inconexos, que no representan realmente el objeto, y que van 
a dificultar el cálculo de parámetros acerca de este. 



Figura 16.21: a) Imagen original con un objeto lineal desconectado, b) Objeto conectado 
tras la aplicación de una operación de cierre, c) Esqueleto del anterior objeto obtenido 
mediante la aplicación de operaciones morfológicas. 

La operación de cierre produce, como hemos dicho, un rellenado de los huecos 
de la imagen. Este efecto es exactamente el que necesitamos en este punto, ya que 
incorporará a la carretera aquellos píxeles que faltan para establecer la conexión 
entre los distintos tramos, y convertir dicha carretera en un único objeto. 

El resultado de aplicar una operación de cierre puede verse en la imagen b ) 
dentro de la figura 16.21. Además de cerrar la vía, ha causado que el elemento 
en conjunto haya aumentado de tamaño y sea ahora más grueso. La forma de 
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corregir este hecho (que no es adecuado para otras operaciones) es lo que veremos 
seguidamente con una nueva operación morfológica: la esqueletización. 

Esqueletización 

Hemos visto cómo resulta posible a partir de la aplicación de métodos sencillos 
reducir el tamaño de los distintos objetos de la imagen, y aplicando estos sucesiva- 
mente, reducir dicho tamaño más y más hasta el punto deseado. Utilizando ideas 
similares podemos reducir un objeto de una imagen binaria hasta un conjunto 
mínimo de píxeles que preserven la forma y las propiedades topológicas del objeto 
original, habiendo eliminado el mayor numero posible de ellos, que quedarían 
como píxeles de fondo. En particular, un conjunto de un único píxel de ancho es 
la estructura mínima que puede obtenerse. 

Este conjunto mínimo de píxeles delimitan el «eje» del objeto, y se conocen 
como el esqueleto de este. La obtención de este esqueleto es de gran utilidad, pues al 
constituir un objeto de máxima simplicidad, facilita buena parte de las operaciones 
que se pueden realizar posteriormente. 

Para ver un caso práctico, volvamos a la figura 16.21. La imagen b ) que hemos 
obtenido tras el proceso de cierre representa, según convenimos, una carretera, 
pero el tamaño de celda de la misma es superior al ancho de la carretera. Por esta 
razón, el objeto que define la carretera tiene un ancho de varias celdas. 

Un parámetro sencillo tal como la longitud de la vía no resulta difícil de medir 
manualmente en esa imagen b ) , pero automatizar ese proceso sobre la misma imagen 
plantea ciertas complicaciones. Puesto que la carretera también tiene un cierto 
ancho, la longitud que queremos calcular no queda definida unívocamente, al menos 
no de una forma inmediata. Baste ver que, sin salimos de los píxeles negros (los 
de carretera), podemos ir de un extremo a otro de esta por muchas rutas distintas, 
saltando de píxel en píxel y obteniendo en estos recorridos longitudes distintas. 

El problema estriba en que, aunque tratemos conceptualmente a esa carretera 
como un elemento lineal — es decir, sin ancho — , en realidad sí que tiene un ancho 
dado, a pesar de que este es sensiblemente menor que su longitud. Si observamos 
ahora la imagen c) dentro de la anterior figura, veremos que estos problemas ya 
no existen. Solo hay una forma de recorrer el conjunto de píxeles de un extremo 
a otro. La medición puede claramente automatizarse, y el algoritmo encargado 
de ello será mucho más simple. 

El esqueleto de la carretera mantiene así las propiedades que nos interesan, 
tales como la longitud, pero de una manera más adecuada para el análisis. De 
hecho, mantiene incluso la topología, la cual habíamos «corregido» aplicando la 
operación de cierre. 

El cálculo del esqueleto puede llevarse a cabo aplicando operaciones similares a 
las que ya conocemos. Estas operaciones se denominan de adelgazamiento ^ , pues su 

8 Habitualmente citadas en su denominación en inglés: thinning 
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efecto es, en efecto, el de adelgazar el objeto. En esencia, puede entenderse como un 
proceso de erosión aplicado repetidamente hasta que al final quede un objeto de un 
único píxel de ancho, y garantizando que no se pierda la topología original (no surjan 
desconexiones). Un algoritmo habitual de adelgazamiento es el propuesto por [283]. 

Otra forma de entender el cálculo del esqueleto de un objeto es a partir de 
distancias. A cada píxel de dentro del objeto se le puede asignar el valor de la 
distancia al píxel de fondo más cercano. Los puntos que forman parte del esqueleto 
cumplen la condición de ser máximos locales de distancia. Es decir, que todos los 
píxeles circundantes están más cerca del borde que el píxel en cuestión 9 . 

En ambos casos, la obtención de un esqueleto, aunque pueda ser diferente 
según la formulación aplicada, mantiene las propiedades del objeto original, pero 
reduciendo este a una expresión mínima y más sencilla de estudiar. 

16.4.3. Estimación de parámetros físicos 

Los Niveles Digitales de las distintas bandas de una imagen expresan la refiec- 
tividad para una longitud de onda dada. Es decir, tienen un significado físico. El 
hecho de que a partir de una fuente de iluminación única se presenten en la capa 
distintos Niveles Digitales es debido a que los distintos elementos de un área de 
estudio reflejan la luz de dicha fuente de forma distinta. 

Una zona boscosa no refleja la luz igual que un embalse, y dos zonas boscosas 
tampoco lo harán igual si sus árboles son de distintas especies o tienen un estado 
fitosanitario diferente. Si los elementos de una área de estudio condicionan la 
radiación reflejada en las distintas longitudes de onda, podemos utilizar esta 
radiación reflejada (la que se recoge en los Niveles Digitales de esas bandas) para 
deducir las propiedades de los elementos. 

Atendiendo a lo anterior surge el concepto de firma espectral. La firma espectral 
es el conjunto de refiectancias en las distintas longitudes de onda que presenta un 
objeto o material dado. Dicho de otro modo, la firma espectral es la «huella dactilar» 
que caracteriza a cada objeto, y que deriva directamente de sus propiedades y de 
cómo estas influyen en la forma en que dicho objeto refleja la radiación incidente. 

En la figura 16.22 pueden verse algunas firmas espectrales características, 
teniéndose así una idea de las diferencias que pueden existir, y también de cómo 
estas pueden utilizarse para el análisis de imágenes. 

Más detalladamente, y para un píxel caracterizado por su firma espectral, dos 
son los tipos de propiedades que se pueden extraer: 

■ ¿Qué hay en ese píxel? Puesto que los distintos objetos van a presentar firmas 
espectrales particulares, pueden caracterizarse las firmas más habituales de 
una serie de objetos tipo, y después tratar de identificar a cuál de ellas se 

9 Aunque sean formulaciones que hayan surgido en campos distintos, este uso de distancias 
es similar en su forma a lo que veremos en el capítulo 19 acerca del cálculo de costes. Los puntos 
de destino que entonces estudiaremos son en este caso los píxeles del fondo 
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Figura 16.22: Firmas espectrales tipo de algunos elementos habituales 


asemeja más la presente en un píxel concreto. Los fundamentos teóricos de 
este proceso, que son de tipo genérico y pueden aplicarse a otras fuentes de 
datos además de las imágenes, se tratarán en el capitulo 20. En este capítulo 
principalmente veremos los aspectos relacionados con la identificación de 
factores físicos a partir de imágenes, que podrán emplearse en conjunción 
con los que se verán entonces. En general, la clasificación de elementos del 
medio hace uso de las denominadas bases de datos espaciales 10 , que recogen 
las características de dichos elementos expresadas en función de las energías 
recibidas en las distintas longitudes de onda. Más información sobre bases 
de datos de firmas espectrales puede encontrarse en [284], 

■ ¿Cómo es lo que hay en ese píxel? Conociendo qué tipo de elemento encon- 
tramos en un píxel (por ejemplo, una superficie de agua como un embalse), 
pueden estimarse asimismo las cualidades particulares del mismo. Caracterís- 
ticas como la temperatura de ese agua tienen efecto sobre la firma espectral, 
y pueden deducirse mediante formulaciones desarrolladas a tal efecto. 
Según sea la propiedad que queremos conocer o el tipo de elemento que preten- 
demos detectar en el terreno, será una u otra longitud de onda (es decir, uno u otro 
sensor y una u otra banda de las imágenes generadas por el mismo) la que aporte 
una información más relevante. En el cuadro 16.1 se muestran de forma resumida 
las aplicaciones principales de las distintas longitudes de onda, en función de los 
procesos en los que dichas radiaciones toman parte. 

Veremos a continuación con algo más de detalle cómo deducir propiedades de 

10 No lia de confundirse esto con la tecnología de bases de datos con capacidad de manejo de 
elementos espaciales, la cual ya hemos visto en otros capítulos. En este caso no nos referimos 
a la tecnología, sino a un conjunto particular de datos que almacenan esas firmas espectrales 
de una serie de elementos conocidos. 
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Región del espectro Procesos 

Aplicaciones 


Rayos X 

Procesos atómicos 

Detección de elementos 
radiactivos 

Ultravioleta 

Procesos electrónicos 

Presencia de H y He en la 
atmósfera 

Visible e IR cercano 

Vibración molecular 

Composición química de la 
superficie. 

Propiedades biológicas 

IR medio 

Vibración y rotación 

molecular 

Composición química de la 
superficie 
y la atmósfera 

IR térmico 

Emisión térmica 

Temperatura de la superficie 
y la atmósfera 

Microondas 

Rotación molecular y 
emisión térmica 

Composición química de la 
atmósfera. 

Propiedades físicas de la 
superficie. 


Cuadro 16.1: Esquema de regiones del espectro, procesos con los que interactúan y 
aplicaciones habituales en función de estos. 


los dos tipos anteriores en relación con tres de los elementos básicos del estudio 
del medio: el suelo, la vegetación y el agua. 


Parámetros de la vegetación 

La vegetación es uno de los elementos que mayor atención han recibido en el 
ámbito del análisis de imágenes. Por ello, existen muchos parámetros que pueden 
emplearse para obtener información sobre la vegetación a partir de imágenes. 

Uno de los parámetros principales son los denominados índices de vegetación. 
Estos índices permiten detectar la presencia de vegetación en una zona y la ac- 
tividad de esta, ya que sus valores están en relación con dicha actividad. Para ello, 
utilizan los valores de reflectancia correspondientes a las distintas longitudes de 
onda, interpretando estas en relación con la actividad fotosintética. 

En términos generales, un índice de vegetación puede definirse como un pa- 
rámetro calculado a partir de los valores de la reflectividad a distintas longitudes 
de onda y que pretenden extraer de los mismos la información relativa a la vege- 
tación, minimizando las perturbaciones debidas a factores tales como el suelo o 
la atmósfera [285]. 

El conocimiento del proceso de fotosíntesis ayuda a comprender la base de 
los índices de vegetación. Por regla general, las plantas absorben radiación en las 
regiones visibles del espectro, en particular en la región del rojo, siendo esta radia- 
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ción la que emplean para su obtención de energía. Por el contrario, las radiaciones 
de menor frecuencia tales como las del infrarrojo no son útiles para el desarrollo de 
la actividad fotosintética, y la absorción de estas provocaría tan solo un aumento 
de la temperatura de la planta que podría ser perjudicial para la misma. Por ello, 
estas frecuencias son reflejadas en su mayor parte. 

Como resultado de lo anterior, las bandas de imágenes de satélite correspon- 
dientes a la zona del infrarrojo van a presentar altos valores de reflectancia, y bajos 
en la banda del rojo en caso de que exista vegetación, lo cual permite localizar esta 
mediante la utilización de dichas imágenes. Este es el fundamento de los índices 
de vegetación. 

Sin necesidad de definir aún ningún índice, podemos ver claramente este hecho 
en la figura 16.23. En ella, se ha creado una imagen en falso color empleando las 
bandas del infrarrojo cercano, el rojo y el verde para los canales del rojo, verde 
y azul respectivamente (los del modelo RGB) 11 . Debido a lo anterior, las zonas 
con cultivos con alto vigor vegetativo aparecen con un tono rojo muy marcado, 
que permite rápidamente identificarlas. 



Figura 16.23: La creación de una imagen de falso color con un esquema RGB=NRG 
permite localizar las zonas de vegetación por su coloración roja intensa. Esto es debido 
a la alta reflectancia en las banda del infrarrojo visible y la baja reflectancia en el rango 
visible, causadas ambas por la actividad fotosintética. 

Dependiendo del tipo de sensor del cual provengan las imágenes a analizar, 
serán unas u otras bandas las que deban emplearse como bandas del rojo e infra- 

n Este esquema es de uso habitual y se denota como RGB = NRG, siendo N = Near infrared 
(infrarrojo cercano), R = Red (rojo) y G = Green (verde). Como regla mnemotécnica, la lectura 
en ingles del acrónimo NRG suena parecida a la del vocablo inglés energy (energía), y es también 
común referirse así a él. 
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rrojo cercano. En el caso particular del sensor LANDSAT, por ejemplo, la banda 
del rojo es la 3, mientras que la del infrarrojo cercano es la 4. 

Según cómo se formulen los índices en base a los valores de las anteriores 
bandas, podemos distinguir dos grupos: 

■ Formulaciones empleando únicamente las bandas del rojo y el infrarrojo 
cercano. Estos se conocen como índices basados en distancia , o intrínsecos. 

■ Formulaciones empleando además los parámetros de la denominada línea 
del suelo. Estos índices se conocen como índices basados en pendiente. 

Veremos más adelante qué representa esa línea de suelo y cómo calcularla. Por 
ahora, veamos algunos de los principales índices del primer grupo. 

El más importante de los índices de vegetación es el índice de Vegetación de 
Diferencia Normalizada (NDVI, Normalized Differential Vegetation Index) [286], 
cuya expresión es la siguiente: 


NDVlJNN (16.4.2) 

siendo R e IR las reflectancias correspondientes al rojo e infrarrojo respectivamente. 

Los valores de este índice se encuentran dentro del intervalo (-1,1). Valores 
altos de NDVI indican la presencia de vegetación. 

Además de permitir localizar las zonas con presencia de vegetación, el NDVI pue- 
de emplearse para conocer otros parámetros relativos a la vegetación, ya que estos 
también condicionan la forma en que esta refleja la radiación. Factores tales como el 
vigor vegetativo, el estado fitosanitario o el contenido en agua de las hojas influyen en 
la forma en cómo los procesos fotosintéticos se producen. Esto tiene un efecto directo 
sobre las radiaciones emitidas en las distintas longitudes de onda, y muy particular- 
mente en las empleadas para la definición de los índices de vegetación. Por ello, son 
una valiosa fuente de información acerca de las variables propias de la vegetación. 

Otros parámetros como el Indice de Area Foliar 12 o el factor C de la USLE 
pueden calcularse en primera aproximación a partir del NDVI, siendo abundante 
la literatura en este sentido. Por ejemplo, para el factor C, la siguiente expresión 
genérica puede servir para estimarlo en función exclusivamente del NDVI [287], 

. NDVI 

C = e “á-ndvi (16.4.3) 


siendo valores habituales a = 2 y ¡3 = 1. 

En la figura 16.24 puede verse el aspecto de una capa de NDVI para la zona 
de estudio habitual. Si se compara con la composición de color mostrada anterior- 
mente puede observarse cómo las zonas sin vegetación presentan tonos oscuros 
(valores bajos de NDVI) y las de vegetación tonos claros (valores altos de NDVI). 

12 Leaf Area Index(LAI) 
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Figura 16.24: (NDVI) 


El número de índices de vegetación dentro de este primer grupo es muy elevado, 
todos ellos con una formulación similar a la del NDVI y tratando de mejorar ciertos 
aspectos de este. Algunos de los más habituales son los mostrados a continuación. 
■ Indice de Vegetación de Razón Normalizada (Normalized Ratio Vegetation 
Index) 


NRVI=: 


A_i 
IR 1 


IR+R+1 

índice de Vegetación Transformado (Transformed Vegetation Index) 


(16.4.4) 


TVI=VNDVI— 0,5 


NDVI >0,5 


(16.4.5) 


índice de Vegetación Transformado de Thiam (Thiam’s Transformed Vege- 
tation Index) 


TTVI = yj |NDVI+0,5| (16.4.6) 

Como hemos dicho, las bandas del rojo y el infrarrojo cercano se corresponden 
en el caso del sensor LANDSAT TM con las bandas 3 y 4 respectivamente. La 
formulación original del NDVI se basaba en datos de dicho sensor, por lo que es 
habitual encontrar este bajo la denominación NDVI43. Si se emplea una notación 
similar, pueden definirse nuevos índices que mantienen la expresión del NDVI, pero 
utilizan distintas bandas como base de su cálculo. Algunos de estos índices deri- 
vados han sido estudiados y documentados en la literatura, y es posible asignárles 
una interpretación del mismo modo que con el modelo base de NDVI. Así, [288] 
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define el NDVI54 y lo relaciona con el estrés hídrico de la vegetación y [289] define 
el NDVI75, el cual presenta una correlación apreciable con la biomasa existente. 

Para el cálculo de los índices de vegetación del segundo grupo se requiere, como 
ya hemos visto, el cálculo de una recta denominada línea de suelo. Esta recta viene 
definida por su pendiente b y el punto a en el que corta al eje de ordenadas, siendo 
estos valores los que se incorporan a las formulaciones de los índices de este grupo. 

El fundamento en el que reside el uso de la linea de suelo y su incorporación 
a los índices de vegetación puede comprenderse con facilidad si se observa la figura 
16.25. Los puntos de la gráfica representada son los correspondientes a los valores 
en las bandas del rojo y el infrarrojo para los píxeles sobre zonas de suelo desnudo. 
A estos se ajusta la recta r mostrada, y los puntos sobre la misma tales como el 
punto X se asocian al suelo desnudo. 



Figura 16.25: Representación gráfica de la línea de suelo, un punto correspondiente a 
suelo desnudo (A) y un punto correspondiente a la presencia de cierta vegetación (A') 

Para ese mismo suelo, una cierta cobertura vegetal haría que el valor correspon- 
diente tuviera una menor reflectancia en el rojo y mayor en el infrarrojo cercano, 
alejándose de la línea de suelo perpendicularmente. Cuanto mayor es la cobertura 
vegetal y mayor la actividad fotosintética, mayor será esta distancia entre el punto 
y la linea de suelo, y por lo tanto su medida puede constituir un índice de vegetación 
válido. Esta es la razón por la que estos índices, como ya se dijo, se conozcan como 
índices basados en distancia. 

El cálculo de la línea de suelo se lleva a cabo siguiendo los pasos enunciados 
a continuación: 

■ Se calcula un índice de vegetación basado en pendiente tal como el NDVI. 

■ Se identifican las zonas sin vegetación (suelo desnudo) en base al anterior. 
Estas tendrán valores negativos próximos a -1. 

■ Se calcula una regresión lineal entre los valores del rojo y del infrarrojo, 
solo con los píxeles de las anteriormente definidas zonas sin vegetación. Se 
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obtendrá una expresión de la forma y = a+bx. Según sea el índice de vege- 
tación, deberá tomarse como variable independiente o bien la reflectancia 
correspondiente al rojo, o bien la del infrarrojo. 

Una vez realizado el proceso anterior, con los coeficientes a y b pueden formular- 
se nuevos índices de vegetación para estimar la distancia anteriormente descrita. El 
índice de vegetación original dentro de este tipo, del cual derivan los restante, es el 
conocido como Indice de Vegetación Perpendicular { PVI, Perpendicular Vegetation 
Index ) [290]. 

Este índice, no obstante, es complejo y además no aporta información sobre si la 
distancia se da hacia el otro lado de la línea de suelo (agua en lugar de vegetación), 
por lo que se han propuesto otros más sencillos y eficaces. Entre ellos, cabe destacar 
los siguientes: 

- [291] 


■ [292] 


PVI = 


fo-IR — R+a 
v / ó 2 -+- 1 


(16.4.7) 


pvi= (IR-a)(R+6) 

Va 2 + 1 


(16.4.8) 


- [293] 


PVI = aIR — 6R 


(16.4.9) 


Un último índice de formulación similar al NDVI es el SAVI ( Soil Adjusted 
Vegetation Index) [294] . Su expresión es la siguiente: 


SAVI =rai (1+i) 

La incorporación del parámetro L minimiza las perturbaciones causadas por el 
suelo y debe estimarse en función de este. El autor recomienda un valor de 1 para 
zonas de vegetación escasa, 0.5 en zonas de densidad media, y 0.25 si la densidad 
de la vegetación es elevada. 


Parámetros del suelo 

El suelo es otro elemento del cual pueden conocerse muchos datos a partir de 
imágenes de satélite. Junto con la inspección visual, que nos permite analizar la 
capa superficial del suelo, las reflectancias a distintas longitudes de onda permiten 
profundizar en este y estudiar también la estructura y propiedades de los horizontes 
inferiores. 

Si en el caso de la vegetación es la actividad fotosintética la que condiciona 
la reflectancia y permite estudiar la presencia y propiedades de la vegetación, en 
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el caso del suelo son cuatro los factores principales que influyen: la composición 
mineralógica del suelo, la humedad, la textura y la materia orgánica. 

Resulta claro que cada mineral va a presentar una comportamiento distinto fren- 
te a la radiación, y ello puede utilizarse para inferir la composición del suelo. Además 
de para el estudio de las propiedades físicas, la clasificación de los suelos es también 
posible a partir de imágenes de satélite, existiendo bases de datos con las firmas 
espectrales de los principales minerales, que pueden aplicarse para clasificarlo. 

Respecto a la humedad, se presentan bandas de absorción marcadas alrededor 
de los 1,4 y 1,9 ¡m i. Por su parte, las bandas del rojo y el infrarrojo cercano 
son indiferentes a la cantidad de humedad presente en suelo. Estas bandas, que 
utilizábamos para la definición de un tipo particular de índices de vegetación, 
también sirven para caracterizar el suelo. La regresión entre ellas da lugar a la ya 
conocida línea del suelo, cuyos valores sirven para definir dicho suelo. 

La materia orgánica, por su parte, influye sobre la capacidad de retención de 
humedad del suelo, por lo que indirectamente afecta a las propiedades ópticas de 
este y condiciona los valores de reflectividad. 

Por último, la textura influye sobre la reflectancia al modificar la forma en que 
la luz incide y se refleja sobre el suelo. La rugosidad y tamaño de las partículas 
causan que estos procesos se den de un modo u otro, y afectan así a las imágenes. 

Junto con los parámetros del suelo que pueden estudiarse directamente a partir 
de la radiación reflejada por este, otros pueden analizarse empleando elementos 
adicionales como, por ejemplo, la vegetación, de la cual ya hemos hablado con ante- 
rioridad. Aunque se requiere un conocimiento exhaustivo de las condiciones existen- 
tes, y debe complementarse su análisis mediante imágenes con el estudio de campo, 
las propiedades de las plantas tales como verdor o coloración pueden relacionarse 
con las propiedades del suelo, esencialmente la disposición de nutrientes en este. 

Parámetros del agua 

El estudio de los elementos hidrográficos (cauces, lagos, etc.) puede llevarse 
a cabo a partir de imágenes desde distintos puntos de vista. 

El uso más inmediato es la delimitación de dichos elementos, ya que resulta 
sencillo identificar estos y sus límites. Las bandas del visible y el infrarrojo cercano 
son las más adecuadas para esta tarea, pues en ellas las superficies de agua se 
presentan de forma más conspicua. 

Junto con la localización de los elementos hidrográficos, las propiedades del 
agua en los mismos son de igual modo materia de estudio. Así, la región espectral 
del infrarrojo térmico aporta información sobre la temperatura del agua, mientras 
que la región del ultravioleta permite la localización de compuestos químicos tales 
como aceites u otros contaminantes. 

Puesto que, como hemos visto, la presencia de vegetación influye sobre la re- 
flectancia, podemos servirnos de algunos conceptos como los estudiados en puntos 
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anteriores para estudiar el contenido en algas y otros organismos fotosintéticos de 
una masa de agua. Otros elementos en suspensión, tanto de naturaleza orgánica 
como inorgánica, influyen de igual modo sobre la reflectancia, y permiten que la 
turbidez del agua pueda ser monitorizada en base a imágenes satelitales. 

Mención aparte merece el estudio de mares y océanos, existiendo satélites 
como NOAA especialmente desarrollados para este propósito. El estudio de las 
temperaturas permite controlar elementos como las corrientes marinas, entre otros. 
La superficie oceánica es también objeto de análisis, pudiendo extraerse valores de 
rugosidad y altura de las olas. Indirectamente, otros parámetros como la velocidad 
del viento, no relativos al agua, pueden derivarse a partir de los anteriores. 

Por último, mencionar que el estudio del agua en estado solido (nieve, hielo) 
comparte algunos de los conceptos anteriores, y puede, por ejemplo, monitorizarse el 
estado del manto de nieve en base a los valores de reflectancia en la región espectral 
del infrarrojo medio. Es de reseñar que en muchos casos la presencia de nieve satura 
los sensores debido a los altos valores de reflectancia que presenta en ciertas bandas. 

Transformación Tasseled Cap 

La transformación Tasseled Cap [295] guarda gran similitud operacional con el 
análisis de componentes principales , el cual veremos en el apartado 20.5, siendo un 
caso particular de este. Se trata de obtener una nueva serie de bandas a partir de 
las del conjunto original como combinación lineal de estas, cada una de ellas con 
un significado bien definido. Este significado guarda relación principalmente con 
la vegetación, aunque se trata aquí por separado y no en la sección anterior corres- 
pondiente, por no ser una formulación únicamente dirigida a este tipo de análisis. 

Los coeficientes de las combinaciones lineales que expresan la transformación 
se encuentran tabulados para los sensores más habituales tales como LANDSAT 
TM+ o MSS, y en función de estos también puede variar el número y significado 
de las bandas resultantes. 

El caso más frecuente es la utilización de bandas del sensor LANDSAT TM, 
empleándose todas ellas excepto la del infrarrojo térmico, es decir, un total de seis 
bandas. Las bandas resultantes (3) corresponden a los ejes de la linea de suelo (que 
expresa la humedad), la vegetación (el verdor) — recuérdese que este es perpen- 
dicular al anterior — y el brillo. Los valores de estas bandas por separado tienen ya 
una interpretación relacionada de forma directa con las variables físicas del medio. 

Las expresiones que relacionan los valores originales del sensor LANDSAT TM 
con los de las bandas de suelo, verdor y brillo son las siguientes: 


Brillo = 0,3037TM1+0,2793TM2 
+0,4343TM3+0,5585TM4 
+0,5082TM5+0,1863TM7 


(16.4.11) 
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Verde = -0,2848TAfl-0,2435TM2 
-0,5436TM3+0,7243TM4 
+0,0840TM5-0,1800TM7 (16.4.12) 


Humedad = 0,1509TAfl+0,1793TM2 
+0,3299TA73+0,3406TAf4 
— 0,71 12TAf 5 — 0, 4572TAL7 (16.4.13) 

Otra transformación cuyos coeficientes se encuentran ya calculados es la que 
parte de datos del sensor MSS, que en este caso genera un total de cuatro nue- 
vas bandas. Las tres primeras expresan respectivamente el brillo, el verdor y el 
denominado Indice de Vegetación Amarilla (YVI, Yellow Vegetation Index), con 
información acerca de la vegetación en mal estado sanitario, y los datos de la 
última pueden asociarse con el ruido atmosférico. 

Las fórmulas a emplear en este caso son las siguientes: 

Brillo = 0,433AÍ55+0,632AÍ552 

+0,586Af 553+0, 264A1554 (16.4.14) 

Verdor = -0,290A7551-0,562M552 

+0,600AÍ 553+0, 491AL554 (16.4.15) 

YVI = -0,829M551+0,522M552 

—0,039Af 553 + 0, 194A/554 (16.4.16) 

Ruido = 0,223M551+0,012M552 

— 0,543 Af 553+0, 810A4554 (16.4.17) 

16.4.4. Detección de elementos 

Uno de los procesos más interesantes basados en imágenes es la localización 
y definición de los distintos elementos de una zona de estudio. Estos pueden ser 
elementos zonales tales como lagos o zonas con una vegetación concreta, pero 
también otros como carreteras o caminos, líneas de alta tensión o árboles puntuales. 
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Como ya sabemos, las imágenes nos permiten una actualización mucho más 
sencilla de las bases de datos espaciales, pero ello requiere extraer de ellas la 
información necesaria para actualizar dichas bases de datos. Cuando el proceso 
de extracción de información se automatiza, la actualización de las bases de datos 
lo hace de igual modo (al menos en cierta medida), aprovechándose realmente 
todo el potencial que las imágenes contienen para mantener actualizados los datos 
geográficos de forma sencilla. 

La clasificación de imágenes, la cual veremos en el apartado 20.2, es una 
herramienta válida a estos efectos, ya que permite asignar una categoría a cada uno 
de los píxeles de una imagen, permitiéndonos convertir una imagen en una capa de 
tipos de suelo o usos de suelo, entre otras, y provee una solución automatizada para 
ello. Por su gran importancia, la veremos con gran detalle en un capítulo aparte. 

Este tipo de procesos, sin embargo, no son siempre suficientes para la creación 
de nuevas capas. A veces se necesita no solo clasificar, sino también detectar los 
distintos elementos que componen la zona que estudiamos, en base principalmente 
a su forma o aspecto. Como veremos, la clasificación utiliza las propiedades de 
cada píxel para asignarle una categoría, pero no tanto las de forma. 

Decíamos al inicio del capítulo que podemos, a partir de imágenes, identificar 
elementos y su características. Estos, sin duda, están relacionados, y las carac- 
terísticas nos pueden servir para la propia identificación del elemento. Esta es 
la forma de operar del proceso de clasificación, pero las características no son 
suficientes. Por ejemplo, para buscar carreteras en una imagen podemos buscar 
zonas asfaltadas (saber si la zona es de asfalto lo podemos hacer a partir de las 
características de los píxeles, del mismo modo que visualmente lo identificaríamos 
por su color), pero pueden existir explanadas asfaltadas que no constituyan una 
carretera. Lo que nos lleva a determinar que una zona constituye una carretera 
es, en conjunto con su características de color, la forma lineal que esta tiene, con 
lo cual el análisis de las cualidades del píxel no resulta suficiente. 

Del mismo modo, extraer la localización de cada árbol dentro de una masa 
arbórea también requiere identificar estos por la forma de sus copas en la imagen, 
al igual que, por ejemplo, la localización de edificios (Figura 16.26). 

En cierta medida, el proceso de clasificación se basa de forma global en una con- 
cepción ráster de los resultados a obtener, mientras que la extracción de elementos 
enfoca dichos resultados como entidades vectoriales (que son, precisamente, esos 
elementos a detectar). Por ello, tiene en realidad mucha relación con todo lo que 
veremos en el capítulo 17. En conjunto con los conceptos que veremos entonces, 
aplicamos también los que conocemos de este capítulo — tales como las firmas 
espectrales — , así como las ya mencionadas ideas sobre clasificación que igualmente 
se detallarán en breve. 

Puesto que la forma es el componente base para la detección de elementos, exis- 
te una relación lógica con aquellas operaciones que denominábamos morfológicas , 
ya que estas operan sobre imágenes y modifican la forma con que dichos elementos 
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Figura 16.26: Identificación automatizada de edificios a partir de una imagen aérea 
(cortesía de Visual Learning Systems, Inc) 


aparecen en ellas. Viendo el efecto de este tipo de operaciones, entenderemos 
fácilmente que pueden servirnos de ayuda para una detección de elementos más 
precisa, pudiendo emplearse en conjunto con otras técnicas para la preparación 
de las imágenes antes del propio proceso de detección. O bien sencillamente para 
la aplicación de los algoritmos que encontraremos en el capítulo 17. 

A día de hoy, la detección de elementos no presenta el mismo nivel de automati- 
zación que otras tareas dentro de los SIG, y no es del todo completa. El exhaustivo 
conocimiento que se requiere de los elementos a detectar o la presencia de ruido 
en las imágenes son algunos de los factores que dificultan obtener resultados 
satisfactorios si se automatiza todo el proceso. Aun así, los avances en este sentido 
son de sumo interés por el gran ahorro de tiempo y costes que suponen para el 
mantenimiento de bases de datos espaciales actualizadas. 

Las técnicas que se emplean en este campo son muy avanzadas e incluyen 
generalmente elementos de inteligencia artificial que permiten al sistema aprender 
e ir mejorando paulatinamente los resultados. Su presencia en los SIG actuales 
no se encuentra muy extendida, pero representan herramientas muy valiosas para 
sacar todo el partido posible a la gran cantidad de imágenes aéreas y de satélite 
de las que disponemos hoy en día. 


16.5. Resumen 

Las imágenes son uno de los elementos base de los Sistemas de Información 
Geográfica, y su análisis y tratamiento es una pieza clave dentro de los procesos que 
pueden llevarse a cabo en estos. Estos procesos incluyen ideas propias del análisis de 
imágenes digitales, en las que no se considera la naturaleza particular de las imáge- 


nes que se usan en un SIG, así como otras en las que sí se considera de forma directa la 
componente espacial y el significado físico de los valores que se recogen en cada píxel. 

El tratamiento de las imágenes debe comenzar con la preparación y corrección 
de estas, eliminando los efectos no deseados que los aparatos de registro o la propia 
atmósfera, entre otros factores, hayan podido introducir en dichas imágenes. 

La imagen corregida puede ser mejorada mediante algoritmos que hagan más 
patente la información en ella contenida, realzando esta tanto de cara a su mero 
análisis visual como para su posterior análisis mediante otras formulaciones espe- 
cificas para el análisis de imágenes aéreas y de satélite. Estas otras formulaciones 
permiten obtener, entre otros resultados, caracterizaciones de elementos del medio 
como el suelo, la vegetación o el agua. 
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En el capítulo 13 vimos cómo crear capas ráster a partir de capas vectoriales, en 
particular capas de puntos. En este capítulo veremos el proceso opuesto: la creación de 
capas vectoriales a partir de capas ráster. Esto completará lo visto anteriormente, de forma 
que sabremos como convertir entre datos vectoriales y datos ráster en ambas direcciones, 
pudiendo disponer de los datos espaciales en el formato que resulte más ventajoso para 
el tipo de trabajo que queramos realizar en cada caso. 

Aunque no son necesarios los conceptos de estadística espacial que se requerían para el 
capítulo sobre capas ráster, sí que es importante, al igual que entonces, conocer en detalle 
las particularidades de los modelos ráster y vectorial. 


17.1. Introducción 

La conversión de datos espaciales desde el modelo vectorial al modelo ráster 
nos servía para obtener un dato espacial mucho más adecuado para el análisis. 
Para variables continuas tales como la elevación, los datos vectoriales resultan más 
difíciles de analizar, por lo que el tipo de conversión que vimos era un paso previo 
para poder acceder a toda la potencia de análisis de un SIG. 

Las ventajas del modelo ráster, que fueron comentadas con detalle en el capítulo 
5, lo convierten en la opción preferida a la hora del análisis de variables continuas, 
pero esta no es, ni mucho menos, la única tarea que podemos realizar en un SIG. 
Para muchas de esas restantes tareas, el modelo vectorial es preferible, pues, como 
ya vimos, también tiene su particular serie de ventajas. 

Si en el capítulo 13 estudiábamos como convertir los datos vectoriales en datos 
ráster, debemos ver de igual forma cómo proceder en sentido inverso cuando esto 
sea posible, y mostrar qué formas vectoriales del dato espacial resulta posible 
obtener a partir de una capa ráster. El proceso que vamos a ver no es sencillamente 
el inverso de lo entonces presentado, sino que implica otra serie de operaciones. 

Así, la conversión de puntos en una capa ráster, que nos ocupó la mayoría 
de paginas en aquel capítulo, no tiene un equivalente en la conversión de una 
capa ráster en una de puntos, pues esta segunda operación resulta obvia con los 
conocimientos que ya tenemos. Basta aplicar las ecuaciones vistas en 14.3 para 
calcular los valores de la variable en dichos puntos. 

Otras operaciones, sin embargo, tales como convertir una capa ráster en una 
capa vectorial no de puntos sino de isolíneas, sí que requieren algo más de expli- 
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cación. Más aún, resulta importante mostrar al lector que esos procesos existen 
y son parte de los procesos que un SIG nos ofrece, para que pueda incorporarlas 
a su batería de herramientas. 

La coexistencia de los datos vectoriales y ráster no solo es una realidad, sino 
que en gran parte de las ocasiones es una necesidad. A lo largo de las distintas fases 
de trabajo dentro de un proyecto SIG, un mismo dato puede emplearse de varias 
formas distintas con objeto de satisfacer las distintas necesidades que aparezcan. 
Como muestra la figura 17.1, para una capa de elevaciones, las conversiones entre 
modelos de datos aparecen en diversos puntos dentro de un ciclo de trabajo habi- 
tual. Una de ellas es una conversión de vectorial a ráster tal y como las que vimos 
en el capítulo anterior. Las restantes son en sentido inverso (de ráster a vectorial), 
como las que trataremos en el presente. 



Figura 17.1: Distintas conversiones de modelo de datos, a lo largo de un proceso de 
trabajo con una capa de elevaciones: a) mapa escaneado, b) curvas de nivel, c) capa ráster, 
d) TIN, e) curvas de nivel. 


En el esquema de la figura, partimos de un mapa escaneado, el cual es una 
imagen donde se pueden ver las curvas de nivel con sus valores de altitud corres- 
pondientes. Se trata de una capa ráster, pero los análisis que podemos realizar a 
partir de ella son prácticamente nulos. En realidad, no es más que un «dibujo». 
Para obtener un dato más susceptible de análisis debemos vectorizar esas curvas de 
nivel, convirtiéndolas en una capa vectorial de líneas. Este proceso de vectorización 
ya se comentó en el capítulo 6, cuando vimos las fuentes de datos más habituales. 
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Como se dijo entonces, esa digitalización puede llevarse a cabo manualmente, 
bien digitalizando en pantalla o bien con alguna otra herramienta más específica. 
Esa conversión no es, sin embargo, la que interesa a este capítulo, ya que aquí 
veremos los procesos y algoritmos que pueden automatizar esta tarea de reconocer 
las líneas de ese mapa escaneado y delinear en base a ellas las entidades de la capa 
vectorial resultante. 

A partir de esa capa de líneas, el siguiente paso es la obtención de una capa ráster. 
Todo lo necesario para llevar a cabo este proceso ya lo hemos visto en el capítulo 13. 

Por último, a partir de esa capa ráster podemos obtener de nuevo un dato 
vectorial tal como un TIN, o bien de nuevo unas curvas de nivel. En el caso de la 
figura, las curvas de nivel son anteriores a la capa ráster, con lo cual este paso no 
resulta de gran utilidad, pues ya disponemos de ellas. Sin embargo, sabemos que 
hay tecnologías que permiten obtener una capa de elevaciones ráster sin necesidad 
de partir de un dato vectorial, y en ese caso la obtención de este último implica 
necesariamente un cálculo a partir de la capa ráster. Las curvas de nivel pueden 
sernos útiles para, por ejemplo, generar un resultado cartográfico, y en este capítulo 
veremos en qué se basan las formulaciones que nos permiten hacer tal conversión. 

A lo largo de este capítulo vamos a ver dos clases de procesos para crear capas 
vectoriales a partir de capas ráster. 

■ Conversión de capas ráster discretas. Vectorización. 

■ Conversión de capas ráster continuas. 

Partiendo de una capa ráster discreta, el proceso de vectorización pretende 
generar una capa vectorial que recoja las geometrías que aparecen en dicha capa. 
Estas geometrías vienen definidas por la forma en que los valores de las mismas 
clases se disponen en la malla de celdas. Este es el caso que encontramos cuando 
disponemos de una capa ráster pero el modelo conceptual del espacio geográfico 
no es modelo de campos sino un modelo de entidades discretas. Cada una de estas 
entidades se constituyen mediante conjuntos de celdas contiguas con el mismo 
valor. Esta idea se recoge en la figura 17.2 

En la conversión de capas continuas, veremos cómo expresar una capa ráster 
continua mediante un conjunto de entidades, en particular mediante lineas y 
polígonos. Para el caso de líneas, analizaremos cómo delinear un conjunto de 
isolíneas a partir de una capa ráster. En el caso de polígonos, estudiaremos cómo 
crear un TIN, estructura de triángulos irregulares que, como ya vimos, sirve para 
almacenar variables continuas, particularmente la elevación. 


17.2. Vectorización de entidades 

La vectorización de entidades tiene como base una capa ráster con una variable 
de tipo nominal u ordinal, en la cual se reflejan distintas categorías. El objetivo 
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Figura 17.2: Vectorización de capas ráster discretas en capas de polígonos (a) y de líneas 
(b). . 


es expresar mediante entidades vectoriales los conjuntos de celdas de una misma 
categoría. 

La necesidad de efectuar este tipo de operaciones va a aparecer en gran parte 
de las ocasiones que encontremos en nuestro trabajo una capa ráster de este tipo, 
pues ya sabemos que esta información resulta más adecuado en la mayoría de casos 
almacenar su información según el modelo de datos vectorial. 

Capas tales pueden surgir en el trabajo con SIG en diversos momentos, pues 
muchas operaciones de análisis sobre capas ráster van a generar este tipo de 
resultados. La conversión de dichos resultados al modelo de datos vectorial va 
a permitir darles un uso distinto y combinar ambos modelos de representación, 
usando cada cual cuando más convenga. 

Estas operaciones pueden partir de capas ráster con variables continuas, de 
las que se extraen entidades de acuerdo a formulaciones diversas. Un ejemplo muy 
característico es la delineación de redes de drenaje y la delimitación de cuencas 
vertientes, operaciones ambas que se realizan a partir de un Modelo Digital de 
Elevaciones, como vimos en el capítulo 15. 

Otros procesos de vectorización que ya conocemos son los que se llevan a cabo 
a partir de cartografía escaneada. En este caso, no obstante, la situación es bien 
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distinta, ya que lo que a simple vista parece una misma línea o un mismo polígono 
en el mapa escaneado, realmente no es un conjunto de celdas con un único valor (es 
decir de un único color), sino con varios valores (colores) similares. Esta situación 
hace más difícil trabajar con este tipo de capas a la hora de vectorizar y reconocer 
las entidades que se deben vectorizar, y requiere procesos previos de tratamiento 
para que ese mapa escaneado se encuentre en las mejores condiciones antes de 
proceder a la vectorización. La figura 17.3 muestra una imagen que contiene líneas 
y polígonos, y junto a ellas las representaciones de estas que resultan óptimas para 
proceder a vectorizarlas como capas de líneas o capas de polígonos respectivamente. 



Figura 17.3: b)Imagen con polígonos y lineas para vectorizar. a) y c) La misma imagen 
tras ser trasformada con objeto de mejorar las condiciones para la vectorización (como 
capas de líneas y polígonos respectivamente) y aumentar la calidad de esta. 


El paso de las versiones originales a estas versiones óptimas implica el uso de 
operaciones de álgebra de mapas, así como las que se vieron en las secciones 16.3.1 
o 16.4.2, dentro del capítulo dedicado al tratamiento de imágenes. Los algoritmos 
que trataremos en esta sección supondrán ya que se trabaja sobre una capa donde 
las entidades a vectorizar están representadas por valores uniformes, dependiendo 
su rendimiento de esta circunstancia. No obstante, haremos mención también a 
los procesos de preparación previos, ya que en algunos casos son parte inseparable 
de ciertos procesos de vectorización muy frecuentes en un SIG. 

Para el lector interesado, una interesante referencia de fácil acceso en la que 
se detallan algoritmos para el tratamiento de imágenes no necesariamente en 
estas circunstancias óptimas es [296] , donde pueden encontrarse algoritmos para 
vectorización de todo tipo de imágenes en color. No obstante, estos algoritmos 
están enfocados a un trabajo fuera del ámbito de los SIG, y por ello pueden no 
satisfacer exactamente las necesidades que se presentan dentro de nuestro campo. 
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17.2.1. Vectorización de líneas 

Volviendo a los algoritmos sobre capas discretas donde las entidades a definir 
están claramente definidas, comencemos con los de vectorización de líneas. Estos 
son similares en cierta medida a los de polígonos que veremos más adelante, aunque 
entrañan en principio algo menos de dificultad técnica. 

Una característica reseñable de los algoritmos de vectorización de líneas son 
sus mayores requerimientos en lo que respecta a las características de la capa 
de partida. Esto es así debido a que, a la hora de vectorizar una línea, vamos a 
necesitar que esta sea, en efecto, una línea como tal. Es decir, que el conjunto de 
celdas que la definen sea un conjunto de un único píxel de ancho, tal y como vimos 
en el apartado 16.4.2 al tratar las operaciones de esqueletización. 

Para el caso de polígonos, si en la obtención de una imagen binaria los polígonos 
han quedado más grandes o más pequeños, o con una forma u otra, este hecho no 
afecta al resultado. El algoritmo los reconocerá y los vectorizará, y su funciona- 
miento será igual en todos casos. Las imprecisiones que puedan existir en la imagen 
binaria se trasladarán a las capas vectoriales resultantes, pero los algoritmos de 
vectorización no verán afectado su funcionamiento por dichas imprecisiones. 

En el caso de las líneas encontramos una situación bien distinta. La presencia 
de píxeles adicionales o la falta de conectividad entre líneas van a dificultar se- 
riamente la vectorización, ya que los algoritmos correspondientes están pensados 
para trabajar sobre entidades lineales que cumplan una serie de características, 
las cuales ya hemos citado anteriormente. 

En ocasiones, las capas con las que trabajamos van a estar en buenas condi- 
ciones de ser vectorizadas (por ejemplo, en el caso ya citado de una red de drenaje 
extraída a partir de un MDE). En otras muchas, sin embargo, las capas ráster con 
las que vamos a trabajar van a requerir procesos previos, habitualmente laboriosos. 
Por esta razón, la obtención de una capa óptima a vectorizar es el obstáculo 
principal que encontraremos, por ejemplo, cuando trabajemos con imágenes, ya 
que estas en la mayoría de los casos no cumplen las condiciones requeridas y han 
de prepararse abundantemente. 

Para ver un ejemplo de lo anterior, trataremos una de las tareas que con más 
frecuencia se presenta dentro del trabajo con SIG: la digitalización de curvas de 
nivel de un mapa impreso. Automatizar la vectorización en sí no es en este caso 
una tarea altamente compleja, pero los procesos tales como la segmentación o 
las operaciones morfológicas que ya conocemos no resultan sencillos de ajustar 
de forma automática para obtener un resultado vectorizable. Es necesario en la 
mayoría de los casos un cierto grado de trabajo manual. 

Debe pensarse que el mapa escaneado es habitualmente una imagen en color, 
más compleja que las imágenes binarias sobre las que se presentaron en el capítulo 
16 las operaciones morfológicas. Por ello, resulta más difícil ajustar estos procesos. 

El paso de una imagen original tal como el mapa escaneado de la figura 17.3 a uno 
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más apto para la vectorización como el de la imagen a) de dicha figura es un proceso 
más complejo de lo que puede parecer, ya que comporta las siguientes dificultades: 

■ Las lineas tienen más de un píxel de ancho 

■ Las líneas tienen píxeles de varios colores distintos 

■ Aparecen elementos adicionales que dificultan la identificación automática 
de las líneas, pues rompen su continuidad. Por ejemplo, es habitual que 
las líneas se encuentren interrumpidas por etiquetas en las que se refleja el 
valor de elevación correspondiente a la misma. Otros elementos tales como 
ríos o carreteras pueden estar representados en el mismo mapa, y trazarse 
por encima de las curvas de nivel, que suelen quedar en un segundo plano. 
Mientras que estos últimos se trazan con colores diferentes a las curvas de 
nivel, las etiquetas tienen el problema añadido de que presentan el mismo 
color que la propia línea, con lo cual no pueden eliminarse en base a dicho color 
con procesos tales como la segmentación (véase el apartado 16.3.1) [297]. 

El problema más grave de los anteriores es la falta de continuidad, el cual puede 
tratar de solucionarse tanto en la parte ráster, como en la vectorial, es decir, antes 
o después de la vectorización como tal. Para el ojo humano, resulta sencillo en 
caso de discontinuidad intuir cual es la conectividad de las lineas, ya que nuestra 
percepción tiende a agrupar aquellos elementos que sugieren una continuidad lineal, 
considerándolos como una entidad única pese a que en realidad no se encuentren 
unidos y sean objetos aislados. Por desgracia, un SIG no comparte con nosotros 
estas capacidades perceptivas, y es necesario que las uniones entre los tramos de 
líneas existan como tales de un modo más tangible. 

Para el caso ráster, ya vimos en su momento (apartado 16.4.2) las operaciones 
morfológicas que nos pueden ayudar a «conectar» las líneas cuando hayan quedado 
separadas por alguna razón. Para el caso vectorial, existen de igual forma diversos 
algoritmos que tratan de realizar esta conexión una vez que la vectorización se ha 
producido y aparecen imprecisiones. En [298] puede encontrarse uno de tales algorit- 
mos vectoriales, que no se detallarán aquí por estar fuera al alcance de este capítulo. 

En líneas generales, y teniendo en cuenta los condicionantes anteriores, la 
vectorización de curvas de nivel a partir de mapas topográficos se lleva a cabo 
siguiendo una cadena de procesos que comporta los siguientes pasos. 

■ Escaneado del mapa original 

■ Filtrados y mejoras sobre la imagen resultante 

■ Segmentación 

■ Operaciones morfológicas 

■ Conversión ráster-vectorial 

siendo en este último paso en el que nos centramos dentro de este capítulo. 

Para esta conversión ráster-vectorial, el algoritmo correspondiente debe seguir 
un esquema genérico como el siguiente, a aplicar para cada una de las curvas de nivel. 

■ Localizar una celda de la curva. 

■ Analizar las celdas alrededor suyo para localizar la siguiente celda de la curva. 
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■ Desplazarse a esa celda. 

■ Repetir los pasos anteriores. 

Este proceso se detiene hasta que se cumple un criterio dado, que es el que 
concluye la vectorización de la línea. En general, el criterio a aplicar suele ser que 
se regrese a la celda de partida, o que no pueda encontrarse una nueva celda entre 
las circundantes (a excepción de la anterior desde la cual se ha llegado a esta) . 

Siguiendo este esquema, se dota de un orden a las celdas de la línea. Mediante 
esta secuencia ordenada de celdas, puede crearse la linea vectorial como una se- 
cuencia ordenada de coordenadas (particularmente, las coordenadas de los centros 
de esas celdas). 

Hay muchos algoritmos distintos de vectorización. Las diferencias van desde 
la forma en que se analizan las celdas circundantes o el criterio que hace que se 
concluya la vectorización de la línea, hasta formulaciones más complejas que siguen 
un esquema distinto. 

Más allá de lo visto en este apartado, la conversión de mapas topográficos en 
capas de curvas de nivel es un proceso complejo del que existe abundante literatura. 
Buenas visiones generales de este pueden encontrarse en [299, 300, 301, 302] 

Además de la vectorización de curvas de nivel, tarea habitual que ya hemos 
visto, existen otras muy variadas que presentan cada una de ellas distintas cir- 
cunstancias. Así, y aún disponiendo ya de una capa que presente las condiciones 
idóneas para ser vectorizada, el proceso puede presentar más dificultad de la que 
con lo visto hasta este punto puede pensarse. No hay que olvidar que, a la hora 
de vectorizar un conjunto de líneas, estas se definen no únicamente por su forma, 
sino por otros elementos tales como, por ejemplo, la topología. 

En el caso particular de vectorizar un conjunto de curvas de nivel tal y como 
lo venimos detallando, esta topología es clara y no entraña dificultad añadida a la 
hora de vectorizar. Por propia definición, las curvas de nivel no pueden cruzarse con 
otras curvas, con lo cual basta seguir el contorno de las mismas y no preocuparse 
de estos cruces. Sin embargo, vectorizar otros elementos implica tener en cuenta 
circunstancias distintas. 

Algo más complejo que vectorizar curvas de nivel es hacerlo, por ejemplo, con 
una red de drenaje (recordemos que en el capítulo 15 vimos cómo extraer esta en 
formato ráster a partir de un MDT) . En este caso sí que existen intersecciones, pero, 
puesto que los cauces solo tienen un único sentido, las formas que el conjunto de estos 
puede adquirir están limitadas. En particular, una red de drenaje es siempre una es- 
tructura en árbol, lo cual quiere decir que no van a existir rutas cíclicas en dicha red 1 . 

Si lo que tratamos de vectorizar es una red viaria, las posibilidades son más 
amplias, y además, como ya sabemos, el modelo ráster no es adecuado para registrar 
completamente la topología de dicha red. La existencia de rutas cíclicas complica 
además los algoritmos de vectorización en caso de que estos pretendan añadir 

1 Desde el punto de vista de la teoría de grafos, un árbol es un grafo acíclico conexo. 
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topología a sus resultados, con lo que la operación no resulta tan sencilla como 
en el caso de las curvas de nivel. 

En resumen, la existencia de topología añade complejidad a la vectorización 
de líneas. Aún así siempre resulta posible (y en muchos casos suficiente) vectorizar 
estas y obtener como resultado una capa sin topología ( spaguetti ). Esta capa, ya 
en el modelo vectorial, puede tratarse posteriormente para dotarla de la topología 
necesaria, en caso de que así se requiera. 

17.2.2. Vectorización de polígonos 

Muy relacionada con la vectorización de líneas, tenemos como herramienta 
habitual dentro de un SIG la vectorización de polígonos. Esta guarda gran similitud 
con la anterior, en cuanto que el proceso se basa también, fundamentalmente, en ir 
siguiendo una serie de puntos y conectarlos, para de este modo definir el contorno 
del polígono. 

Los puntos que nos interesan para la delineación de un polígono no son, a 
diferencia del caso de líneas, todos los que conforman el objeto a vectorizar, sino 
tan solo una parte de ellos. En concreto, van a resultar de interés únicamente las 
celdas exteriores, es decir, las que al menos tienen una celda circundante con un 
valor distinto al del propio polígono a vectorizar (en el caso de trabajar con una 
imagen binaria, las que tienen al menos una celda circundante que pertenece al 
fondo). Las celdas internas no nos aportan información relevante, ya en ellas no 
se va a situar ninguna de las coordenadas de la entidad vectorial que buscamos. 

Siendo dichas celdas externas las que debemos tratar para delinear la enti- 
dad vectorial, el primer paso es, por tanto, su localización. Esta no es difícil si 
recordamos algunas de las operaciones morfológicas que vimos en el capítulo 16. 
Por supuesto, la aplicación de estas exige que se den, una vez más, una buenas 
condiciones en la imagen, en particular que la frontera del polígono a vectorizar 
esté claramente definido. Para ello basta, como ya hemos dicho, que el valor dentro 
del polígono sea uniforme (valor que consideraremos como si fuera el 255 o 1 
de las imágenes binarias, según lo comentado en su momento), y distinto de los 
restantes a su alrededor (valores todos ellos que consideraremos como el valor 0 
de las imágenes binarias, que entonces identificábamos con el fondo) 

De las operaciones morfológicas que conocemos, la erosión nos da una idea de la 
forma de proceder a la hora de localizar las celdas importantes. De la forma en que 
lo presentamos entonces, el proceso de erosión elimina aquellas celdas que se sitúan 
en contacto con el fondo y están en el borde del objeto. Estas son exactamente 
las que nos interesan de cara a la vectorización. Como muestra la figura 17.4, la 
diferencia entre una imagen binaria y dicha imagen tras un proceso de erosión es 
el contorno del objeto. 

El proceso de erosión se aplica en este caso con un elemento estructural como 
el siguiente, en lugar del que vimos en el apartado 16.4.2. 
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Figura 17.4: a) Imagen base con un polígono a vectorizar. Las celdas que forman el 
contorno se muestran en gris, b) La imagen anterior tras un proceso de dilatación, c) 
Contorno del polígono obtenido a partir de la diferencia entre las dos imágenes anteriores. 
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Esto no es estrictamente necesario ya que, de aplicar el que vimos enton- 
ces, y aunque el contorno resultante sería distinto, el resultado sería igualmente 
vectorizable 2 . 

Sobre este contorno, el proceso de digitalización ya no difiere, a primera vista, 
del que efectuábamos sobre una curva de nivel. El objetivo es asignar un orden 
a las celdas de ese contorno, de modo que siguiendo dicho orden quede definido 
el perímetro del polígono. 

Para ello, y como en el caso de las curvas de nivel, basta comenzar en uno de los 
puntos e ir siguiendo de un modo sistemático el contorno, añadiendo las coordenadas 
de los puntos recorridos. Dichas coordenadas, no obstante, no son en este caso las de 
los centros de las celdas, sino que se deben tomar las de los vértices para que esta for- 
ma se almacene el contorno de cada una de las celdas externas al objeto vectorizado. 
Particularmente, son de interés las coordenadas de aquellos vértices que se sitúan en 
el lado exterior del contorno. Esto puede comprenderse mejor viendo la figura 17.5. 

2 Otra forma de ver esto es la siguiente. A la hora de ir recorriendo el contorno podemos 
hacerlo desplazándonos solo en horizontal y vertical (como lo haría la torre en un tablero de 
ajedrez), o bien en todas direcciones (como lo haría la reina). Con el elemento estructural que 
vimos en la sección 16.4.2 el contorno resultante puede ser recorrido haciendo movimientos de 
torre, mientras que con el que hemos aplicado en este caso (y como puede apreciarse en la figura) 
recorrer el contorno exige movimientos en diagonal. 

En la jerga del tratamiento de imágenes se dice que existe conectividad-4 en el primer caso y 
conectividad-8 en el segundo, haciendo referencia al numero de celdas circundantes a las que 
uno puede desplazarse según cada uno de estos esquemas de movimiento 

Otra forma habitual de referirse a estos conceptos es hablar de vecindad de Von Neumann para 
el caso de 4 posibles conexiones o vecindad de Moore para el caso de 8. 
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Figura 17.5: Mientras que en la vectorización de líneas (a) se toman las coordenadas 
del centro de la celda, en el caso de polígonos (b) se deben utilizar las de los vértices para 
delinear completo el contorno del objeto. 


Los resultados en los dos supuestos representados en la figura son bien distintos, 
a pesar de que el objeto a vectorizar es el mismo, pero en un caso se interpreta 
como una línea y en otro como un polígono. 

Un algoritmo para vectorizar el contorno de un polígono debe localizar una cel- 
da de dicho contorno e ir avanzando hasta rodear por completo este, almacenando 
las coordenadas de los bordes exteriores de todas las celdas recorridas. El avance 
se detiene cuando se vuelve a la misma celda en la que se comenzó, momento en el 
cual el proceso de vectorización queda completo. En [303] puede encontrarse con 
más detalle la descripción un algoritmo de esta forma, parte de cuyos fundamentos 
pueden emplearse igualmente para la vectorización de líneas. 

Al igual que sucedía con dichas líneas, la complejidad del objeto puede presentar 
problemas para su vectorización. El algoritmo anterior no contempla, por ejemplo, 
la presencia de «huecos» en el polígono. Como ya conocemos, esos huecos son 
polígonos internos que han de incorporarse a su vez a la entidad, y por tanto deben 
ser a su vez vectorizados. 

17.3. Isolíneas 

Otro resultado vectorial que puede generarse a partir de una capa ráster son 
las isolíneas o curvas de nivel. Aunque el caso más habitual es utilizarlas para 
representar elevaciones (tal y como aparecen en un mapa topográfico habitual), 
se emplean también para otro tipo de variables de tipo continuo tales como la 
presión (isóbaras), la precipitación(isoyetos) o el tiempo (isócronas). La forma de 
obtenerlas a partir de una capa ráster es, no obstante, la misma en todos los casos. 

Aunque, como ya sabemos, las variables de tipo continuo como la elevación 
se recogen de forma más ventajosa en el modelo de representación ráster, y este 
permite un mejor análisis de estas, hay diversas razones por las que puede resultar 
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de interés el disponer de esa misma información expresada como un conjunto de 
isolíneas. La más habitual de ellas es la necesidad de incorporar información de 
elevaciones en un documento cartográfico que recoja algún otro tipo de variable. 

Las curvas de nivel se integran fácilmente con otro tipo de capas, de forma más 
adecuada que si utilizamos una capa ráster o un TIN. Por ejemplo, en la figura 17.6 
se muestra un mapa de pendientes y junto a este el mismo mapa pero con curvas 
de nivel correspondientes a la elevación. Combinar las dos variables (pendiente 
y elevación) en un solo mapa no tendría un resultado similar si se usara una capa 
ráster de elevaciones en lugar de curvas de nivel. 



Figura 17.6: Adición de curvas de nivel a un mapa de pendientes. Estas facilitan la 
interpretación a la vez que no interfieren con la visualización del mapa principal 


De este modo, las curvas de nivel aportan una valiosa información adicional y 
facilitan la interpretación de la variable principal (la pendiente) , pero sin interferir 
en la visualización de esta. Veremos más acerca de los mapas de isolíneas y su 
representación en el apartado 27.6.3. 

El calculo de curvas de nivel puede realizarse a partir de una capa ráster, pero 
también a partir de una capa de puntos con datos de elevación. En este ultimo caso, 
no obstante, ya sabemos que podemos convertir esos puntos en una capa ráster 
mediante métodos de interpolación (según lo visto en el capítulo 13), y después 
en base a este calcular las curvas de nivel. En esta sección trataremos únicamente 
la delineación de curvas de nivel a partir de capas ráster. 

Un método basado en triangulación para obtener curvas de nivel a partir de 
puntos distribuidos irregularmente se detalla en [304] . Una revisión detallada de 
métodos disponibles para esta tarea se puede encontrar en [305] . 

Respecto al cálculo a partir de una estructura regular como una capa ráster, 
los algoritmos correspondientes no derivan únicamente del trabajo con SIG, sino 
que se trata de un área muy desarrollada en el tratamiento de imágenes digitales. 
Las curvas de nivel ponen de manifiesto las transiciones existentes en los valores 
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de la imagen, y estos puede resultar de interés para una mejor interpretación de 
esta o la automatización de ciertas tareas. 

Existen dos enfoques principales a la hora de trazar curvas de nivel en base 
a una malla de datos regulares [306] 

■ Seguimiento de líneas 

■ Análisis por celdas 

En el seguimiento de líneas, se localiza un punto que pertenezca a la curva de 
nivel y después se «sigue» esa curva de nivel hasta que se alcanza un borde de la 
malla ráster, o bien la curva se cierra regresando al punto inicial. 

La localización de un punto de la curva se hace empleando métodos de inter- 
polación, del mismo modo que veíamos en la sección 14.3 al tratar las técnicas de 
remuestreo. Como es lógico pensar, los valores de las curvas de nivel que se van a tra- 
zar son en generales valores «redondos» (múltiplos de 100 o 200, por ejemplo). Por 
el contrario, los valores de las celdas pueden ser cualesquiera, y salvo en casos parti- 
culares, los valores de las curvas de nivel no van a presentarse en los valores exactos 
de las celdas, que por convenio corresponden como sabemos a los centros de estas. 

Dicho de otro modo, las curvas de nivel no pasan por los centros de las celdas, 
pero si que atraviesan estas. Los métodos de interpolación se emplean para saber 
por dónde exactamente atraviesa la celda la curva de nivel correspondiente, ya que 
con los valores de una celda y sus circundantes, correspondientes a sus respectivos 
centros, pueden estimarse valores en puntos no centrales de estas. 

Cuando una curva de nivel entra en una celda, obligatoriamente debe salir 
de ella (una curva de nivel, por definición, no puede concluir bruscamente salvo 
que se encuentre en el extremo de la malla de celdas). Los mismos métodos de 
interpolación se emplean para calcular por dónde sale y hacia qué celda lo hace. 
Sobre esa celda se aplicará un análisis similar, y de este modo se produce ese 
seguimiento de la linea que resulta en el trazado completo de la curva de nivel. 

El resultado de este proceso es un conjunto de puntos que unidos secuencial- 
mente conforman la curva de nivel buscada. 

Estos métodos tienen la ventaja de que, al presentar la linea como un continuo, 
dan resultados mejores para su representación (esto era especialmente importante 
cuando se empleaban plotters para la impresión de esos resultados), y es más fácil 
etiquetar el conjunto de líneas [307]. Esto es así debido a que los métodos que 
realizan un análisis por celdas no tratan la curva de nivel como una única entidad, 
sino como un conjunto de pequeños tramos, cada uno de los cuales definido en el 
interior de una única celda. 

Aunque el resultado visualmente puede ser el mismo, la capa generada mediante 
un método de seguimiento de curvas va a contener menos entidades y ser más 
correcta desde un punto de vista semántico, ya que una curva se expresa como una 
única entidad, no como un conjunto de ellas. 

Entre los métodos de análisis por celdas, uno con gran relevancia (especialmente 
en el tratamiento digital de imágenes) es el conocido como Marching Squares, una 
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adaptación bidimensional del algoritmo tridimensional Marching Cubes presentado 
en [308]. 

El fundamento de este método es el hecho de que, si una curva de nivel atraviesa 
una celda, existen únicamente 16 posibles configuraciones de los vértices de esa 
celda en función de si su valores correspondientes están dentro o fuera de la curva 
de nivel. La figura 17.7 muestra esas configuraciones. 


nana 

12 3 4 

miran 

5 6 7 8 

nrann 

9 10 11 12 

ranran 

13 14 15 16 

Figura 17.7: Posibles configuraciones de una celda según el algoritmo Marching Squares. 
Los vértices en negro están dentro de la curva de nivel, mientras que los blancos se 
encuentran fuera. 


En base a esto, se recorren todas las celdas, se analiza en cuál de las configuracio- 
nes se encuentra cada una de ellas y, cuando corresponda, se traza una linea entre el 
punto de entrada y de salida de la curva de nivel en la celda. Estos puntos se calculan, 
al igual que ya veíamos para los métodos de seguimiento, mediante interpolación. 

El algoritmo no establece relación alguna entre las celdas por las que pasa 
una misma curva de nivel, sino que toma estas separadamente. Por ello, aunque 
visualmente los tramos que resultan estén conectados, son considerados como 
segmentos independientes a la hora de generarlos, y también a la hora de su manejo 
una vez la capa de curvas de nivel ha sido creada. 

Además de este inconveniente, el método presenta algunas ambigüedades, como 
puede verse en la figura 17.7 para los casos 6 y 11. En estos supuestos no está clara 
cuál es la forma en que la curva de nivel atraviesa la celda. En los métodos de 
seguimiento no existe esta deficiencia, ya que se sabe desde qué celda llega la curva 
de nivel. 
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17.4. Creación de TIN 

Ya conocemos los TIN como estructuras vectoriales utilizadas para almacenar 
una variable continua tal como la elevación. Como vimos en el capítulo 5, estos 
están formados por un conjunto de puntos que, utilizados como vértices de triángu- 
los, dan lugar a una red de triángulos interconectados que cubren toda la superficie 
estudiada. 

Estos triángulos aparecen en mayor número en las zonas donde la variable 
presente una mayor variabilidad (relieve más abrupto) y en menor número cuando 
no existe una variabilidad tan acusada (relieve llano). 

La creación de un TIN a partir de otro modelo de datos como, por ejemplo, 
una capa ráster, implica las siguientes operaciones: 

■ Selección de puntos más representativos. 

■ Triangulación de dichos puntos. 

17.4.1. Selección de puntos 

No todas las celdas de la capa ráster son igual de interesantes a efectos de crear 
un TIN. Si tomásemos todas las celdas y las utilizáramos como vértices, el TIN 
resultante sería sin duda preciso, pero el número de triángulos sería muy elevado. 
No estaríamos aprovechando la gran ventaja de los TIN, que no es otra que su adap- 
tabilidad en función de la variabilidad de cada zona, ya que no estaríamos teniendo 
en cuenta esta variabilidad para tomar más o menos puntos según sea necesario. 

Si se debe tomar un número de puntos menor, es necesario un método para 
eliminar aquellos que aportan menos valor al TIN resultante, de forma que, con 
los puntos que se consideren, este sea lo más preciso posible 3 . 

La selección de las celdas que deben considerarse como vértices de la red 
puede llevarse a cabo mediante diversos algoritmos. El algoritmo conocido como 
VIP( Very Important Points 4 ) [309] es uno de los más habituales. Se basa en evaluar 
la significancia de cada celda y después eliminar aquellas menos significantes hasta 
quedarse con un número n de celdas, que serán las más relevantes y por tanto las 
más adecuadas para formar el TIN. El criterio de eliminación de celdas menos 
significantes puede también basarse en un umbral de significancia, de forma que 
solo se consideren como vértices las celdas que lo superen. 

La significancia de una celda se obtiene mediante un análisis local con una 
ventana 3x3, estudiando las cuatro posibles direcciones que pasan por la celda 
central (Figura 17.8). 

En cada dirección se traza una recta que pasa por dos puntos extremos, te- 
niendo en cuenta la elevación de los mismos. La distancia entre la celda central 

3 Elegir un número de puntos dado y obtener el mejor TIN posible con ese número no es una 
tarea en absoluto sencilla. Se trata de un problema matemático de los conocidos como NP-Hard. 

4 Puntos Muy Importantes 
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Figura 17.8: La significancia de una celda es la media de las significancias según las 
cuatro direcciones definidas. Para una dirección definida (en rojo), la significancia es la 
distancia d entre la celda central y la recta que une las celdas de los extremos 


y dicha recta es la que define la significancia. La media de las cuatro significancias 
calculadas según todas las direcciones posible es la significancia global de la celda. 

Otro algoritmo basado en análisis local es el propuesto por [310], que se basa 
en el análisis de las formas del terreno mediante ventanas 3x3y2x2,y busca 
hallar los puntos más representativos mediante la caracterización del tipo de forma 
del terreno. El análisis mediante la ventana 2 x 2 es muy similar a lo que vimos 
en el análisis hidrológico para la localización de celdas cóncavas, en el capítulo 15. 

Un enfoque distinto a los anteriores es el propuesto por [311] , denominado drop 
heuristic , que crea un TIN con todas las celdas 5 y después recorre iterativamente 
todos sus vértices, eliminando aquellos que se evalúen como de menor importancia. 

17.4.2. Triangulación 

Una vez se tiene el conjunto de puntos significativos, es necesario conectar estos 
para formar la red de triángulos como tal, existiendo para ello existen diversas 
metodologías. 

Para una conjunto de puntos V, una triangulación es una conjunto de triángulos 
que cumple las siguientes propiedades[312]: 

■ El conjunto de todos los vértices de esos triángulos es igual a V 

■ Cada lado de un triángulo contiene únicamente dos vértices. 

■ La intersección de dos triángulos cualesquiera es nula 

■ La unión de todos los triángulos forma la envolvente mínima convexa del 
conjunto de puntos 6 . 

Los algoritmos de triangulación de un conjunto de puntos se basan la mayoría 
en considerar la tarea como un problema de optimización, siendo diversos los 

5 Realmente no es un TIN sensu stricto, puesto que no es irregular. Los vértices presentan 
la misma estructura regular que caracteriza a la capa ráster de la que parte. 

6 Este es un polígono de gran importancia que veremos en la sección 18.6.1. 
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criterios aplicados. No obstante, las propiedades de la triangulación es interesante 
que guarden relación con el uso que vamos a darle al considerarla el elemento 
definitorio de un TIN, siendo esta una estructura en la que recogemos en general 
la forma de un terreno. 

Puesto que dentro del triángulo van a asumirse unas propiedades constantes 
(pendiente, orientación), la idea es que los triángulos engloben áreas que, efecti- 
vamente, sean constantes en este aspecto. Esto se logra favoreciendo la creación 
de triángulos con ángulos cercanos a 60°, de modo que dichos triángulos sean lo 
más homogéneos posibles, evitándose aquellos de formas alargadas. 

La forma más habitual de lograr esto es creando un tipo particular de triangu- 
lación conocida como Triangulación de Delaunay[ 313]. Esta presenta las siguientes 
propiedades: 

■ Dado un triángulo cualquiera de dicha triangulación, el círculo que en que 
se inscribe no contiene a ningún otro punto. 

■ Dados cuatro puntos que forman dos triángulos contiguos, la triangulación 
maximiza el mínimo ángulo interno del cuadrilátero formado. 

Esta ultima propiedad es de especial interés para garantizar que los triángulos 
son óptimos en cuanto a su capacidad de representar fielmente el relieve. 

La triangulación de Delaunay es el dual de otra estructura denominada Tesela- 
ción de Voronoi, como puede verse en la figura 17.9. La teselación de Voronoi asocia 
a cada punto un polígono que representa el lugar geométrico de las coordenadas 
que tienen a dicho punto como punto más cercano de todos los del conjunto. Esto 
es similar a lo que veíamos para el método de interpolación por vecino más cercano, 
el cual genera, de hecho, una teselación de Voronoi' . 

Los algoritmos para crear una triangulación de Delaunay son abundantes, y 
existe mucha literatura al respecto. Comparaciones entre los más habituales y 
descripciones de estos pueden encontrarse en [314] y [315], donde se tratan con 
detalle los más importantes. La dirección Web [316] describe asimismo más detalles 
sobre triangulaciones de puntos y polígonos. En la dirección Web [317] puede 
encontrarse un applet interactivo en el que poder experimentar la creación tanto de 
la triangulación de Delaunay como de la teselación de Voronoi a partir de puntos 
introducidos por el usuario. 

Aunque este tipo de triangulaciones son las más recomendables, la propia 
naturaleza de un TIN puede aprovecharse para crear otras triangulaciones deri- 
vadas que, aun no cumpliendo las condiciones de la triangulación de Delaunay, 
representan de forma más fiel el relieve. La incorporación de las denominadas 
líneas de ruptura * 8 o líneas de falla es una de las modificaciones de mayor interés. 

Dentro de un triángulo se asume que la pendiente y la orientación son cons- 
tantes, y dicho triángulo define un plano en el espacio. Al pasar de un triángulo 

' Aunque en aquel momento lo analizábamos desde un punto de vista ráster. 

8 Breaklines, en inglés 
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Figura 17.9: Teselación de Voronoi (en trazo discontinuo) y Triangulación de Delaunay 
(en trazo continuo) a partir de un conjunto de puntos (en azul) 


a otro, el cambio se produce justo en el lado que comparten dichos triángulos, 
representando dicho lado una linea de cambio. Si estas líneas de cambio coinciden 
con las lineas naturales en las que el relieve real que se quiere modelizar sufre un 
cambio brusco, el modelo obtenido será más fiel a la realidad. 

En base a esta idea, puede forzarse a que dichas fallas naturales coincidan 
con los lados de los triángulos, definiéndolas explícitamente junto a los puntos 
que van a formar la base de la triangulación. La triangulación resultante no es de 
Delaunay, pero es más cercana a la verdadera forma del terreno, ya que incorpora 
información adicional. 

17.4.3. Simplificación 

Además de los métodos anteriores para seleccionar un conjunto reducido de 
puntos significativos y los algoritmos para obtener una red de triángulos a partir 
de estos, otro procedimiento importante es la simplificación de una red ya creada. 

Como se muestra en la figura 17.10, pueden eliminarse puntos de una trian- 
gulación y rehacer esta con los puntos restantes. Este es el fundamento del proceso 
de simplificación, eliminando progresivamente vértices y, cada vez que uno de ellos 
es eliminado, recalculando la triangulación de la mejor forma posible. 

Este procedimiento de simplificación es similar al que vimos para el algoritmo 
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de selección de puntos drop heuristic, que partía de un TIN muy denso con todas las 
celdas ráster como vértices. Si en lugar de partir de dicho TIN se comienza con otro 
calculado según algún otro algoritmo, este puede irse simplificando hasta alcanzar 
un nuevo nivel de precisión fijado de antemano . La figura 17.11 muestra un TIN y dos 
versiones simplificadas del mismo, de distinto grado de simplificación. Nótese cómo 
en la imagen, si se eliminan puntos del exterior, varía el contorno de la triangulación. 



Figura 17.11: TIN original (a) y dos simplificaciones (b, c) en base al anterior. 


Más detalle sobre algoritmos de simplificación puede encontrarse en [318]. 

17.5. Resumen 

Las capas ráster pueden convertirse en capas vectoriales empleando algoritmos 
a tal efecto. Estos algoritmos pueden aplicarse sobre capas ráster de variables conti- 
nuas o discretas, siendo distintos en cada caso. En el caso de variables discretas, las 
capas vectoriales generadas definen las geometrías que las distintas clases dentro 
de la capa ráster forman. Estas geometrías pueden ser poligonales o lineales. 

En el caso de variables continuas, las capas vectoriales que se generan pueden 


ser de los tres tipos básico de geometrías: puntos, líneas o polígonos. Para generar 
una capa de puntos, la conversión no requiere ningún algoritmo específico, pues 
basta calcular los valores de la capa ráster en las coordenadas de dichos puntos. 
Para representar una variable continua mediante líneas, se crea una capa de iso- 
líneas. Por último, para el caso de polígonos, una estructura como un TIN puede 
generarse igualmente a partir de la capa ráster, seleccionando los puntos más 
importantes y después triangulándolos. 



Capítulo 18 


Operaciones geométricas con datos vectoriales 


Las capas vectoriales contiene una parte de información geométrica (las geometrías 
como tales) y otra de carácter no geométrico (los atributos asociados) En este capítulo 
veremos cómo a través de operaciones geométricas pueden modificarse, combinarse y ana- 
lizarse esas geometrías, y cómo estas operaciones son en cierta medida las equivalentes 
en el ámbito vectorial al álgebra de mapas ráster que vimos en el capítulo anterior. 

Al igual que entonces, se requiere un buen conocimiento del formato vectorial, y en este 
caso también conocer los cálculos básicos en R 2 y las relaciones espaciales, que fueron ambos 
descritos en el capítulo 10. Al final de este, habrás aprendido cómo llevar a cabo operaciones 
espaciales con ambos modelos de representación, estando así ya en disposición de elegir 
el más adecuado en cada caso y emplear eficientemente todo tipo de datos espaciales. 


18.1. Introducción 

El análisis de los datos ráster se basa fundamentalmente en el análisis de sus va- 
lores. Esto es debido a que las entidades geográficas asociadas a esos valores (las cel- 
das) , presentan una regularidad estructural propia del formato, de la cual no se pue- 
de derivar nueva información. Más aún, según vimos en el capítulo 14, resulta nece- 
sario homogeneizar dicha estructura, lo cual centra la atención del anáfisis en los va- 
lores recogidos y no en las formas geométricas a los que dichos valores caracterizan. 

Con los datos vectoriales, la situación es diferente. En el caso de datos vecto- 
riales, las entidades asociadas a cada atributo tienen sus propias características 
espaciales y la geometría que definen sirve por sí sola para llevar a cabo numerosos 
anáfisis. Si la unimos a los atributos que esta geometría lleva asociados, tenemos 
la posibilidad de realizar un número mayor de estos análisis. 

En este capítulo veremos una serie de operaciones que transforman los datos 
vectoriales actuando sobre sus geometrías, con el concurso en algunos casos de 
los atributos de estas. Los resultados de estas operaciones son nuevas capas cuyas 
geometrías aportan información adicional a las geometrías originales, o bien las 
transforman para que su uso sea más adecuado en otros análisis u operaciones. 

Una buena parte de estas operaciones trabajan con dos capas, siendo similares 
en concepto (que no en la naturaleza de las operaciones que implican) a las funcio- 
nes de tipo local del álgebra de mapas, empleadas para combinar varias capas con 
distintas valores. Otras requieren una sola capa, y aplican transformaciones en 
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función de valores y geometrías o simplemente geometrías, pudiendo considerarse 
en cierta forma el equivalente a las funciones focales del álgebra de mapas ráster. 

Muchas de las operaciones geométricas que pueden realizarse con datos vec- 
toriales pueden llevarse a cabo empleando el álgebra de mapas de capas ráster 
si disponemos de la misma información en ese formato. Otras, sin embargo, no 
son adecuadas para efectuarse sobre una base ráster, del mismo modo que algunas 
operaciones del álgebra de mapas no se pueden llevar a cabo (o al menos no de 
una forma que resulte adecuada) utilizando datos vectoriales. 

Esta equiparación entre el álgebra de mapas ráster y estas transformaciones 
geométricas (también una especie de álgebra de mapas vectorial, en cierta medida) 
puede plantear una disyuntiva desde el punto de vista del usuario de SIG que 
pretende analizar sus datos. Utilizar uno u otro modelo a la hora del análisis repre- 
senta una elección igual que lo es el optar por una u otra forma de almacenamiento, 
vayamos o no a efectuar análisis sobre los datos almacenados. Sin embargo, no 
son opciones mutuamente excluyentes, y lo ideal es conocer los puntos fuertes y 
débiles de cada planteamiento, para así combinar ambos de la mejor forma posible. 
Como ya sabemos, los SIG hoy en día no son puramente ráster o vectoriales, sino 
que incluyen herramientas con ambos planteamientos. Utilizarlas conjuntamente 
es la forma más idónea de aprovechar toda su potencia. 


18.2. Zonas de influencia 

Una de las transformaciones más importantes con capas vectoriales es la crea- 
ción de zonas de influencia, también conocidas como buffers. Esta transformación 
puede llevarse a cabo con entidades de tipo punto, línea o polígono, y su resultado 
siempre es una nueva capa de polígonos. Las áreas cubiertas por estos polígonos 
reflejan las zonas de influencia de cada entidad, influencia que se considera la 
ejerce hasta una distancia dada. Pueden verse también de forma inversa, como 
una influencia recibida, de tal modo que todos los elementos dentro de la zona de 
influencia afectan a la entidad que la genera. 

Por ejemplo, comenzando con un ejemplo de entidades puntuales, sea un 
conjunto de antenas de radio y una coordenada que representa la posición en la 
que nos encontramos. Si estas antenas tienen un alcance máximo (una dimensión 
máxima de su zona de influencia) , es sencillo ver si estamos dentro de dicho alcance 
y recibimos la señal de alguna o varias de ellas. Para ello, basta crear zonas de 
influencia de los puntos donde se sitúan las antenas y después comprobar si el 
punto donde nos situamos esta dentro de alguna de dichas zonas. Para esto último, 
ya conocemos formulaciones específicas como las que vimos en 10.3. 

Como se muestra en la figura 18.1, este análisis se puede realizar de dos formas 
distintas, según se considere la influencia ejercida por las distintas antenas o la 
recibida por el punto de análisis. En el caso a), se calculan las zonas de influencia 
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correspondiente a cada una de las antenas, y posteriormente se comprueba si 
el punto analizado se encuentra en el interior de alguna de ellas. En el caso 
b), por el contrario, el planteamiento es opuesto. Tomando el punto donde nos 
encontramos, calculamos una zona de influencia alrededor de dicho punto, y 
después comprobamos si alguna de las antenas cae dentro de esta zona. En ambos 
casos, si esa comprobación tiene un resultado positivo nos encontramos en un punto 
de cobertura. Si el resultado es negativo, estamos fuera del alcance de las antenas. 

El hecho de poder plantear este análisis de dos formas distintas es debido a 
que, según lo visto en 10.3, en un espacio métrico se tiene que, para dos puntos A y 
B, la distancia entre A y B {(Iab) es igual a la distancia entre B y A ( dsA )■ Pueden 
calcularse zonas de influencia basadas en otro tipo de medidas que no cumplen 
la anterior propiedad, aunque las operaciones correspondientes se llevan a cabo 
sobre capas en formato ráster, y las estudiaremos en el capítulo 19 



Figura 18.1: Zona de influencia a partir de puntos. La influencia puede analizarse a 
partir de los puntos que la ejercen (a) o los que la reciben (b) 

Calcular una zona de influencia de un punto es un procedimiento sumamente 
sencillo, ya que esta zona es simplemente un circulo centrado en el punto y con 
radio la distancia máxima de influencia. En el caso de considerar líneas en lugar de 
puntos, la operación es conceptualmente similar, aunque el algoritmo subyacente 
es notablemente más complejo. No obstante, la interpretación es idéntica. 

En la figura 18.2 podemos ver cómo el trazado de un cauce se transforma en 
un área que engloba todos aquellos puntos que se sitúan a una distancia del cauce 
menor que el umbral establecido. 

Podemos utilizar este tipo de zonas de influencia para, por ejemplo, estudiar 
qué industrias pueden afectar la calidad de las aguas de un río. Teniendo el trazado 
de este río y el emplazamiento de las industrias, podemos hacer una zona de 
influencia del cauce para una distancia máxima de influencia y ver cuáles de estas 
últimas se sitúan dentro de ella. 

De igual modo que en el ejemplo anterior, el análisis se pueden plantear de 
forma contraria, calculando las zonas de influencia de cada industria y viendo si 
estas cortan al trazado del cauce. Aquí podemos ver que, aunque los procedimientos 
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para puntos y líneas sean distintos, su significado es el mismo, y por ello pueden 
utilizarse las zonas de influencia creadas a partir tanto de unas como de otras 
geometrías, indistintamente. 



Figura 18.2: Zona de influencia a partir de elementos lineales (cauces). 

En el caso de polígonos, y puesto que ya conforman regiones, las zonas de influen- 
cia pueden establecerse no solo hacia el exterior, sino también hacia el interior de la 
geometría (Figura 18.3). En el caso de extender el área del polígono, la interpreta- 
ción es la misma que en los ejemplos anteriores. Por ejemplo, para un polígono que 
delimita el perímetro de un núcleo urbano, su zona de influencia puede indicar la ex- 
tensión de territorio al que los habitantes de ese núcleo podrían desplazarse en busca 
de algún servicio, o bien la de la región de procedencia de quienes pueden acudir a la 
ciudad en busca del mismo. Una zona de influencia hacia el interior, sin embargo, nos 
indicaría por ejemplo qué habitantes no es probable que salgan del núcleo urbano 
en busca de un servicio dado, ya que este desplazamiento es demasiado costoso. 

Otro uso habitual de este tipo de zonas de influencia la encontramos en la gestión 
de costas. Si consideramos una zona de protección costera de una dimensión dada, el 
polígono de influencia hacia el interior calculado con esa distancia y el contorno de la 
zona interior representa las zonas a menos de dicha distancia de la costa. Por tanto, 
son aquellas zonas fuera de la zona de protección sobre las que pueden establecerse 
actividades tales como la edificación o implantación de infraestructuras. 

Mientras que la zona de influencia exterior no tiene ningún límite, la trazada 
hacia el interior viene limitada por las propias dimensiones del polígono de origen. 

Sobre la base anterior de zonas de influencia delimitadas a partir de las geome- 
trías fundamentales, existen muchas variantes y formas de construirlas. Un proceso 
habitual es la creación no de una única zona de influencia para cada entidad base, 
sino de un conjunto de ellas equiespaciadas, de tal forma que puedan considerarse 
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Figura 18.3: Zona de influencia a partir de polígonos, a) Hacia el exterior, b) hacia el 
interior. 


distintos grados de influencia. Este conjunto de zonas de tamaños sucesivos forman 
una serie de polígonos concéntricos que pueden, además, representarse de forma 
distinta para reflejar más explícitamente su significado (Figura 18.4). 



Figura 18.4: Zonas de influencia concéntricas a partir de una entidad lineal 

Es fácil ver que si se trazan dos áreas de influencia de tamaño r y 2r a partir 
de una geometría de un tipo cualquiera, esta última es equivalente al área de 
influencia creada a partir de la primera, con distancia r. 

La dimensión de una zona de influencia no debe ser constante para todos los 
elementos que componen la capa de base. Considerando el caso de una capa de 
cauces, no parece lógico considerar que todos los cauces van a tener una zona de 
influencia idéntica. Los cauces con un mayor caudal deberían tener una zona de 
influencia mayor, mientras que los pequeños afluentes deberían estar asociados 
a zonas de influencia menores. 

Trabajando con una capa de puntos en lugar de una de líneas, como la mencio- 
nada en el ejemplo de las antenas, pudiera darse una situación en la que no todas 
ellas tuvieran la misma potencia y el alcance de su señal fuera distinto en cada 
caso. En este supuesto debería establecerse un radio distinto para los círculos de 
influencia de cada antena. 

Tanto el caudal del cauce como la potencia de la antena son atributos de la 
entidad que estarán en su correspondiente tabla de atributos. Utilizando estos pue- 
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den crearse capas de influencia variables que tengan en cuenta las características 
puntuales de cada elemento geográfico. Es decir, se toma en cada caso la dimensión 
del área de influencia de la tabla de atributos, en lugar de ser un valor fijo. 

La figura 18.5 muestra el aspecto de una zona de influencia calculada a partir 
de una red de drenaje, cuya dimensión se establece en función del orden jerárquico 
de cada tramo. 



Figura 18.5: Zonas de influencia variable establecidas en función de los ordenes de los 
cauces. 

Otra de las modificaciones que se pueden plantear a la creación de zonas de 
influencia es la simplificación de estas cuando existen solapes. En el resultado 
de la figura 18.1 puede verse cómo las distintas zonas de influencia se solapan en 
algunos puntos. No obstante la zona global que se ve afectada por la presencia de 
los puntos (antenas según suponíamos para el ejemplo), puede reflejarse de igual 
modo con un único polígono, ya que, puesto que existe contacto entre las zonas, 
puede simplemente considerarse el contorno del conjunto. 

En general, todas las entidades geográficas se prestan a la creación de zonas 
de influencia sin ninguna consideración especial. No obstante, en el caso de curvas 
o polígonos muy convolucionados pueden en ocasiones darse formas incoherentes. 


18.3. Operaciones de solape 

Las operaciones de combinación de capas equivalentes a las expresadas en el 
álgebra de mapas mediante funciones locales son las operaciones de solape. Estas 
operaciones permiten generar nuevas capas vectoriales a partir del cruce de dos 
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Figura 18.6: Zona de influencia única a partir de un conjunto de zonas de influencia 
individuales que se solapan. 


de ellas, pudiendo dichas capas de origen contener distintos tipos de entidades, 
aunque principalmente regiones (polígonos). 

La naturaleza de estas operaciones es bien distinta a la de sus equivalentes ráster. 
Por una parte, se basan en cálculos geométricos que utilizan las coordenadas de cada 
entidad para obtener nuevas entidades resultantes. Por otra, se aplican operaciones 
lógicas sobre las capas de entrada para generar los resultados. Estas operaciones de 
tipo lógico (verdadero/falso) , que como vimos también pueden aplicarse celda a cel- 
da entre dos capas ráster, son las que definen cada una de las operaciones de solape. 

En dichas operaciones se aplican intensamente los conceptos de relaciones 
espaciales vistos en 10.4, y es en función de ellos como, a partir de los resultados 
geométricos, se generan las capas finales resultantes. 

Encontramos los siguientes tipos de operaciones de solape: 

■ Recorte 

■ Diferencia 

■ Intersección 

■ Unión 

Estas operaciones pueden entenderse como operaciones de conjuntos y visuali- 
zarse mediante sencillos diagramas, de forma similar a lo que veíamos en la sección 
11.3.1 al presentar los diagramas de Venn (Figura 18.7). 

18.3.1. Recorte 

Una de las aplicaciones que veíamos de las funciones locales para capas ráster 
era la combinación con objeto de restringir la extensión de una capa de entrada. 
Utilizábamos una capa con la información de interés y otra con una «máscara», 
la cual indicaba qué celdas resultaba de interés preservar en la capa resultante. 

En el caso vectorial, la operación de recorte toma una capa con cualquier 
tipo de entidades donde se contienen los parámetros de interés, y otra capa de 
polígonos que contiene aquellas regiones que resultan de interés. La capa resultante 
mantiene el mismo tipo de información, pero solo mantiene aquellas entidades 
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Figura 18.7: Tipos de operaciones de solape entre dos elementos individuales. 

que se incluyen total o parcialmente dentro de alguno de los polígonos de recorte, 
modificando dichas entidades cuando corresponda. 

Esta operación se conoce como clipping en inglés y es habitual verla así citada 
o implementada en los SIG. 

En la figura 18.8 podemos ver cómo la capa de entrada con polígonos, líneas 
y puntos se restringe a una extensión menor manteniendo dentro de dicha zona 
la misma información original. Se considera en este ejemplo un único polígono de 
recorte, pero pueden ser varios, e incluso polígonos con huecos interiores, sin que 
exista diferencia alguna en la operación. 



Figura 18.8: Recorte vectorial de un conjunto de capas de puntos, líneas y polígonos, 
con una capa de polígonos. 

Para los puntos, solo se mantienen aquellos que se sitúan dentro del polígono 
de recorte. Para las líneas, se mantienen aquellas que entran dentro del polígono 
o lo cruzan, recortándose para que no salgan de este. Y en el caso de polígonos, 
estos se recortan para restringir su extensión a la del polígono de recorte. 

Un aspecto muy importante en el recorte de capas vectoriales es el tratamiento 
de las tablas de atributos asociadas a cada elemento. Salvo en el caso de puntos, 
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en el caso de recortar alguna capa de otro tipo, las geometrías de esta se modifican, 
y en la capa resultante se contiene la geometría modificada y asociado a ella el 
mismo registro original. 

Cuando la capa recortada es de puntos, no existe problema en esto, ya que no se 
da modificación alguna de las geometrías. El recorte es en realidad una operación 
de consulta y selección. La información de la tabla sigue correspondiéndose con la 
entidad geométrica, ya que ninguna de las dos ha cambiado. Cuando se recortan 
líneas o polígonos, sin embargo, la situación es algo más compleja. 

Supongamos que la capa recortada es de polígonos tales como unidades ad- 
ministrativas. Si el registro original contiene información tal como por ejemplo 
el nombre de la unidad o su código postal asociado, no existe ningún problema, ya 
que estos valores se aplican de igual modo para la parte de cada polígono que quede 
tras el recorte. Una situación muy distinta la tenemos cuando la tabla de atributos 
contiene valores tales como el área, el perímetro o el número de habitantes de dicha 
unidad administrativa. En este último caso, dichos valores guardan una relación 
directa con la geometría, y al cambiar esta deberían modificarse igualmente. 

No obstante, la operación de recorte no actúa sobre las tablas de atributos, 
ya que no posee información suficiente para poder hacerlo. Tanto el área como el 
perímetro deben recalcularse para que la información de la tabla de atributos sea 
coherente con el nuevo polígono al que se encuentra asociada. Como ya sabemos, 
medir estas propiedades de un polígono es sencillo a partir de sus coordenadas, 
y debe simplemente tenerse esa precaución. Se tiene que el recorte de la capa no es 
únicamente una operación geométrica, sino que, según sean los valores de la tabla 
de atributos, debe operarse también con ellos para completar dicha operación. 

El caso del número de habitantes es algo distinto al del perímetro o el área, ya 
que no es una propiedad puramente geométrica. Puede calcularse el número de 
habitantes del polígono recortado aplicando una mera proporción entre las super- 
ficies original y recortada, pero el valor resultante solo será correcto si la variable 
(es decir, el número de habitantes) es constante en el espacio. Entramos aquí en 
el problema de la falacia ecológica, el cual vimos en la sección 10.2.2, y que es de 
gran importancia a la hora de aplicar operaciones de solape. 

Cuando la capa recortada es de líneas, debe considerarse de igual modo el hecho 
de que ciertas propiedades dependen directamente de la geometría, y por tanto 
definen la linea completa, no la parte de esta que queda tras el recorte. La longitud 
es un claro ejemplo de esto. Al no constituir regiones, el Problema de la Unidad 
de Área Modificable y otros problemas derivados no se han de considerar de la 
misma forma que en el caso de capas de polígonos, pero es necesario igualmente 
estudiar los valores de la tabla de atributos, para ver cómo el recorte de la capa 
afecta al significado de estos. 
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18.3.2. Diferencia 

La diferencia es un operador contrario al recorte. En este último se mantienen 
en la capa resultante las geometrías de la capa recortada, pero tan solo aquellas 
que entran dentro del área de recorte definida por otra capa adicional (la capa de 
recorte). En la diferencia el proceso es semejante, pero en este caso las zonas que se 
mantienen son las que no entran dentro de la zona definida por la capa de recorte. 

Puede entenderse como la realización de un recorte, pero en lugar de utilizando 
un conjunto de polígonos de recorte, empleando su complementario. 

Mientras que el recorte era útil para restringir la información de una capa vec- 
torial a un área dada, la diferencia es útil cuando deseamos excluir dicho área de la 
capa. Por ejemplo, dada una zona de influencia de un cauce, recogida esta en una ca- 
pa vectorial de polígonos, puede interpretarse de cara a una planificación del terreno 
como una zona no apta para la edificación. A la hora de llevar a cabo un estudio rela- 
tivo a dicha edificación, es interesante eliminar las zonas de influencia, ya que no van 
a tenerse en cuenta de ahí en adelante al no ser aptas para la actividad analizada. 

Por su similar naturaleza, todas las consideraciones anteriormente hechas para 
el caso del recorte deben igualmente tenerse presentes al aplicar la operación 
diferencia. 

18.3.3. Intersección 

La intersección es equivalente a una operación booleana Y (AND), ya que la 
capa resultante mantiene solo aquellas zonas para las que se dispone de información 
en ambas capas de entrada. Es decir, aquellas zonas donde hay entidades en ambas 
capas. En particular, estas entidades han de ser de tipo polígono. 

A diferencia del recorte, la información empleada para crear la tabla resultante 
no proviene únicamente de una capa (la capa recortada) , sino de ambas capas de 
origen. Por ello, se producen modificaciones en las geometrías, que se dividen (se 
«trocean» ) según sea la intersección con las geometrías de la otra capa, y también en 
las tablas de atributos. Los atributos de cada una de las nuevas entidades son todos 
los asociados a las entidades que han dado lugar a dicha entidad intersección. Puesto 
que solo se mantienen en la capa resultante las entidades donde exista coincidencia, 
siempre habrá información en ellas sobre ambas capas. Es decir, la tabla de atributos 
resultante tiene tantos campos como el conjunto de las dos capas de partida. 

Puede verse un sencillo ejemplo en la figura 18.9. 

El hecho de que en la tabla aparezcan dos campos con el mismo nombre no 
implica que deban en modo alguno «mezclarse» los valores de estos. Simplemente 
existirán en la tabla resultante dos campos distintos con un nombre coincidente. 

Al igual que en el caso anterior, de existir capas con valores que guarden relación 
con el área de cada polígono, los valores en las tablas pierden su significado al llevar 
a cabo la intersección. De hecho, podrían existir en ambas capas de origen sendos 
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ID Tipo Suelo 

1 Camblsol 

2 Luvisol 



ID Uso Suelo 

1 Pastizal 

2 Matorral 


b) 



ID Tipo Suelo ID 
1 Cambisol 1 

1 Cambisol 2 

2 Luvisol 1 

2 Luvisol 2 


Uso Suelo 

Pastizal 

Matorral 

Pastizal 

Matorral 


Figura 18.9: Intersección entre dos capas de polígonos, mostrando las geometrías y la 
tabla de atributos resultante. 

campos con un valor de área, que aparecerían ambos en la tabla de la capa resultante. 
Ninguno de ellos, no obstante, sería aplicable a la entidad a la que hacen referencia. 

Este caso que acabamos de ver es idéntico en concepto al que veíamos en el 
apartado 14.2.1 sobre combinación de capas mediante el álgebra de mapas. No 
obstante, si se recuerda lo visto entonces, era necesario codificar de forma particular 
los valores en las capas de entrada para llevar a cabo correctamente la operación de 
combinación. Esto era así porque la capa resultante debía contener la información 
de las dos capas de entrada (tipo de suelo y uso de suelo, en aquel ejemplo), pero 
debía almacenar dicha información en un único valor, ya que una capa ráster tiene 
tan solo un valor asociado a cada celda. 

Al trabajar con capas vectoriales, no existe esa limitación, y cada entidad puede 
llevar asociados tantos campos como se quiera. Por esta razón, no es necesario 
«preparar» las capas de entrada y modificar sus valores, ya que toda la información 
que contienen puede incorporarse a la capa resultante sin más que añadir los 
campos en los que se encuentra. 

18.3.4. Unión 

Si la intersección se puede asimilar a un operador lógico Y (AND), la unión es 
semejante al operador lógico O (OR). En la capa resultante del proceso aparecen 
todas las geometrías de la intersección y, junto a estas, también aquellas que 
corresponden a las zonas que aparecen únicamente en una de las capas de origen. 
Al cruzar estas capas, y al igual que en el caso de la intersección, sus geometrías 
se «trocean», pero en este caso todos esos «trozos» obtenidos aparecen en la capa 
resultante, y no solamente algunos de ellos. 

De esta forma, y al unir dos capas de polígonos, encontraremos en la capa 
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resultante zonas que están cubiertas por uno de ellos perteneciente a la primera 
capa, o bien por uno de la segunda capa, o bien por polígonos de ambas capas. 
Si, por ejemplo, esas capas representan zonas de influencia de sendos procesos, 
podremos de este modo conocer qué procesos afectan a cada una de las geometrías 
resultantes, y saber si, dentro del perímetro de dicha geometría, estamos dentro 
de la zona de influencia de ambos procesos, o bien solo en la de uno de ellos. 

En general, la unión resulta de interés cuando estudiemos la existencia de dos 
fenómenos y queramos ver dónde tiene lugar al menos uno de dichos procesos. En 
la intersección buscábamos conocer en qué lugares tenían lugar los dos fenómenos 
simultáneamente. 

La tabla de atributos correspondiente es igual a la de la intersección, con tantos 
campos como el conjunto de las dos capas de partida. En este caso, no obstante, 
y por existir polígonos resultantes que no aparecerían en la intersección (zonas 
donde solo uno de los fenómenos representados se produce) , aparecerán campos sin 
información, ya que no existen información suficiente para asignarse en esos casos. 

La figura 18.10 muestra un ejemplo de unión de capas vectoriales. 



b) 



ID (a) ID (b) 

1 1 
1 

1 

2 


Figura 18.10: Unión de dos capas de polígonos, mostrando las geometrías y la tabla 
de atributos resultante. 


18.3.5. Polígonos espúreos 

Las operaciones geométricas de solape cruzan las geometrías de dos capas 
y calculan los elementos resultantes de la intersección de estas. Al llevar esto a 
cabo, es probable que en ciertos lugares existan líneas de estas capas que debieran 
coincidir pero que, debido a imprecisiones en su digitalización o a la precisión 
particular de cada capa, no lo hagan exactamente. Es decir, una misma realidad 
queda registrada de formas distintas en las diferentes capas de origen. 

A la hora de efectuar la intersección anterior, esa falta de coincidencia va a dar 
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lugar a polígonos adicionales que no deberían estar ahí. Estos, además, serán de 
pequeño tamaño, ya que las imprecisiones son pequeñas en relación al tamaño de 
las geometrías intersecadas. Estos polígonos son artificios fruto de las imprecisiones 
existentes en las capas sobre las que se realiza la operación geométrica en cuestión, 
y su eliminación es un paso complementario a dicha operación, el cual debe llevarse 
a cabo igualmente. 

La aparición de polígonos espúreos (también frecuentemente citados en su 
denominación inglesa, sliver polygons) puede evitarse a la hora de realizar la 
intersección, incorporando en los algoritmos correspondientes una cierta tolerancia 
que permita que líneas distintas puedan tratarse como idénticas(como deberían 
ser en realidad), siempre que la diferencia entre ellas no supere dicha tolerancia. 

Otra solución es la eliminación a posteriori, tratando de localizar los polígonos 
espúreos diferenciándolos de aquellos que sí representen regiones reales que deben 
conservarse. Algunas de las características que suelen presentar habitualmente 
y que pueden emplearse para esa distinción son: 

■ Pequeño tamaño 

■ Forma alargada 

■ Bajo número de lados. Son polígonos simples con pocos segmentos. 

La figura 18.11 muestra un ejemplo de la aparición de este tipo de polígonos. 



Figura 18.11: Aparición de polígonos espúreos de pequeño tamaño tras el solape entre 
capas con discrepancias. 


18.4. Juntar capas 

Juntar capas no es una operación geométrica propiamente dicha, ya que nin- 
guna de las geometrías de las capas de entrada se ve alterada en lo que a sus 
coordenadas respecta. Es, no obstante, una operación de combinación, ya que, al 
igual que las anteriores, genera una nueva capa de datos espaciales vectoriales a 
partir de dos capas de partida. En realidad puede aplicarse sobre un número n 
de capas, aunque por simplicidad suponemos que estas son solo dos. 

El resultado es una nueva capa que contiene la información de las dos capas 
de entrada, es decir todas las entidades que se encuentran en una u otra de estas. 
Sobre dichas entidades no se realiza ningún análisis geométrico, y el hecho de 
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que estas intersequen o no carece de relevancia para el resultado. Las relaciones 
espaciales entre entidades de ambas capas no se tienen en cuenta. 

Por ello, si dos entidades por ejemplo poligonales, una de cada una de las capas 
de partida, se intersecan, ambas aparecerán en la capa resultante como tales, sin 
verse afectadas. En la zona de intersección habrá dos polígonos distintos. Esto no 
sucedía en las operaciones de solape vistas anteriormente. 

La parte principal de la operación no es, por tanto, la relativa a las geometrías, 
ya que estas simplemente se «reúnen» en una sola capa. La consideración más impor- 
tante es la que respecta a la información asociada a la capa resultante, que proviene 
de las dos capas de origen y define realmente el significado de dicha capa resultante. 

La tabla de la capa resultante contiene tantos elementos como existan en el 
conjunto de capas de partida. Si estas contienen respectivamente n y m elementos, 
la capa resultante tendrá n+m entidades. Para cada elemento se recogen tantos 
campos como campos diferentes aparezcan entre las dos tablas. Las entidades de 
una de las capas, si no tienen valores para los campos provenientes de la otra — por 
no aparecer este campo en ambas — no tendrán valor alguno. Algunos SIG dan 
la opción de seleccionar qué capa es la capa principal, cuyos campos se emplearan 
para la capa definitiva. La información de las otras capas que se recoja en cam- 
pos no existentes en dicha capa principal se perderá en la capa resultante. Con 
independencia de la imple mentación, el concepto es similar en todos los casos. 

Para comprender mejor esta operación, puede verse un ejemplo en la figural8.12. 



Figura 18.12: Ejemplo de las tablas y entidades resultantes tras juntar dos capas. 

Para aplicar esta operación de forma coherente y que la tabla generada según 
lo anterior tenga pleno sentido, ambas capas de origen tienen que contener no solo 
el mismo tipo de entidades, sino también información de índole similar. Salvo en 
contadas ocasiones, no tiene sentido unir, por ejemplo, una capa de polígonos y 
otra de líneas, y será mejor mantenerlas independientes a todos los efectos. De 
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modo similar, tampoco tiene sentido unir una capa de polígonos con valores de 
uso de suelo y otra con límites administrativos, ya que las tablas de datos de estas 
serán bien distintas y el resultado será poco coherente. La similitud en cuanto al 
tipo de entidad no garantiza que la operación tenga sentido. 

La operación de juntar capas es útil en muchas circunstancias en las cuales se 
dispone de datos geográficos de distintas procedencias o que, por su propio origen, 
vienen divididos en partes. Un caso frecuente es el de disponer de la información por 
hojas coincidentes con la cartografía clásica, tales como las hojas proporcionadas 
por los Institutos Geográficos o instituciones similares. Si la zona estudiada cubre 
varias de estas hojas, tendremos los datos divididos en tantas capas distintas como 
hojas cubiertas. Sin embargo, lo ideal sería tenerlas todas en una única capa. 

Esta conveniencia no solo es relativa al manejo de la capa, sino también para 
otros aspectos tales como el análisis o incluso la visualización. A la hora de analizar 
los datos, muchas formulaciones utilizan no solo la geometría o los valores asociados 
a esta, sino también la relación con otros elementos de la misma capa. Tal es el 
caso en el análisis de redes, por ejemplo. Si la red de carreteras que recorre esas 
hojas en las que se sitúa la zona de estudia se encuentra en diversas capas, no se 
refleja la conectividad entre las carreteras de distintas hojas. Deben juntarse en 
una única antes de poder analizarlas conjuntamente. 

Otras operaciones no requieren de esa conectividad, pero el aplicarlas sobre la 
información contenida en las capas implica hacerlo tantas veces como capas existan. 
En lugar de calcular, por ejemplo, un área de influencia de dichas capas, hay que 
calcular ese mismo área para cada capa. Después estas zonas de influencia podrían 
juntarse en una sola capa, pero resulta más lógico hacerlo a priori y después operar. 

Juntando las capas, la visualización también se ve afectada. Además de no 
poder analizar conjuntamente ese conjunto de carreteras cuando están en capas 
separadas, tampoco pueden modificarse conjuntamente los atributos de represen- 
tación. Cambiar el color o el grosor de las líneas que representan las carreteras 
implica cambiar ese color o grosor para cada una de las capas, para que el resultado 
sea visualmente homogéneo. 

Si la paleta de colores no es de tipo absoluta y no utiliza una tabla de asignación, 
sino que adapta una rampa de colores entre los valores mínimos y máximos del 
campo utilizado para asignar los colores, es absolutamente necesario unir las capas 
que queramos para conseguir un resultado coherente. De otro modo, la misma 
rampa de colores no representará lo mismo en cada capa, ya que los máximos y 
mínimos entre los que se adapta serán distintos para cada parte (cada capa) , y 
en el caso más habitual distintos asimismo de los correspondientes al total de los 
datos de la zona de estudio. 

Por ejemplo, sean dos capas de polígonos, una con los países de Asia y otra con 
los de Europa. Si las representamos conjuntamente pero como capas separadas 
según lo anterior, y lo hacemos en función de su población, tendremos que China 
tendrá el mismo color asociado que Alemania (ambos son los países más poblados 
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de cada continente), pese a que la población del primero es 15 veces mayor que 
la del segundo. Juntando las capas lograremos una representación coherente. Este 
mismo ejemplo lo veremos de modo gráfico en el capítulo 22. 

Pueden juntarse capas no solo porque abarquen áreas distintas con una misma 
información, sino también si cubren el mismo área pero con informaciones distintas. 
Estas informaciones deben compartir, no obstante, algún rasgo común. Una capa 
de carreteras y otra con caminos pueden juntarse para formar una capa con las 
vías existentes en la zona de estudio. 


18.5. Modificaciones basadas en atributos. Disolución 

Las tablas de atributos pueden emplearse para definir la forma en que se realiza 
una operación geométrica. En lugar de ser elementos pasivos que no se ven modi- 
ficados tras la operación, los atributos pueden ser quienes aporten la información 
necesaria para establecer la manera de modificar las entidades de entrada. 

Una operación muy frecuente en este sentido es la llamada disolución. Esta 
operación recibe este nombre debido a que une polígonos con atributos comunes y 
«disuelve» las fronteras existentes entre ellos en una única entidad. No es necesario 
que exista una frontera entre los polígonos (es decir, que sean contiguos) ya que 
pueden almacenarse en una capa vectorial entidades compuestas por varios polígo- 
nos disjuntos. Tal es el caso, por ejemplo, de una entidad poligonal que represente 
a España, que contendrá no solo el polígono de la península, sino también los de 
las islas que también pertenecen al país. Para todos ellos existe un único registro 
en la tabla de atributos asociada. 

La aplicación de la operación disolver hace que todos aquellos polígonos que 
tengan asociado un determinado valor en uno de sus atributos pasen a constituir 
una nueva y única entidad, ya sea esta de un solo polígono o varios disjuntos. No 
obstante, los SIG habituales implementan la posibilidad de efectuar la disolución 
tan solo cuando exista adyacencia, de tal modo que la entidad resultante siempre 
será en este caso un único polígono simple. 

Este es el caso que aplicábamos, por ejemplo, a la hora de simplificar las zonas 
de influencia. En dicho caso se unen simplemente por contigüidad espacial todas 
las zonas generadas, asumiéndose por tanto que todas tienen algún valor común 
en sus atributos. 

No obstante, pueden disolverse las entidades según distintos grupos, tantos 
como valores distintos de un atributo existan en la capa. Un ejemplo muy re- 
presentativo en este sentido es obtener a partir de una capa con provincias una 
nueva con polígonos que representen comunidades autónomas. Es decir, agrupar 
un tipo de división en otra a una escala mayor. Para ello, por supuesto, debe existir 
información sobre a qué Comunidad Autónoma pertenece cada provincia, para 
poder aplicar la condición que permita seleccionar los polígonos a disolver. 
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En la figura 18.13 se muestra un ejemplo de lo anterior. 



Figura 18.13: Obtención de una capa de comunidades autónomas a partir de una de 
provincias mediante un proceso de disolución. En la capa original se han representado 
los polígonos en función de la comunidad a la que pertenecen. Aunque aparecen con el 
mismo color, son polígonos independientes. 


Al igual que en otras operaciones ya vistas, la tabla de atributos de la capa 
resultante merece atención aparte. En esta ocasión, existe un comportamiento 
diferente según si el atributo es numérico o no. Si el campo no es de tipo numérico, 
la unión de n entidades en una única implica «juntar» la información n valores 
no numéricos. Puesto que estos no permiten operaciones de tipo matemático, no 
es posible utilizar esos valores y obtener un valor para ese campo en la nueva capa. 
Por ello, estos campos no aparecen en la tabla resultante. 

En el caso de campos numéricos, pueden emplearse los datos de las capas de 
partida, aplicando operaciones diversas según sea la naturaleza de la variable. Por 
ejemplo, para un campo con el número de habitantes de cada término municipal, 
si aplicamos una operación de disolución y obtenemos una capa de comunidades 
autónomas, el valor de población de cada entidad resultante (cada comunidad 
autónoma), será la suma de los valores de los polígonos que han sido «disueltos» 
para obtener dicha entidad. 

Si el campo en cuestión recoge la estatura media de la población, el valor resul- 
tante deberá ser una media ponderada de los valores de cada término, utilizando 
el número de habitantes como ponderación. Si en lugar de la media se recoge la 
estatura máxima, el máximo de todos los valores de los términos será el valor a 
incluir en la tabla de atributos de la capa resultante en ese campo. 

Una vez más, es necesario considerar la naturaleza de la variable para establecer 
la forma de combinar los valores. Al hacerlo, y al igual que en otros casos, no deben 
perderse de vista los efectos derivados de la agregación que llevamos a cabo, los 
cuales ya conocemos. 
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18.6. Contornos mínimos 

Dado un conjunto de puntos, una de las operaciones geométricas más comunes 
que pueden llevarse a cabo es la delimitación de un contorno mínimo que los 
englobe. Conocer el espacio ocupado por este contorno puede ser útil para evaluar 
diversos parámetros tales como la zona de cobertura del fenómeno representado 
por dichos puntos. 

Existen diversas formas de contornos mínimos, entre las que cabe destacar. 

■ Envolvente convexa mínima 

■ Rectángulo mínimo 

■ Círculo mínimo 

18.6.1. Envolvente convexa mínima (convex hull) 

La envolvente convexa mínima (habitualmente citada como convex hull, su deno- 
minación en inglés) es la más común de las envolventes. Define el polígono convexo 
de menor área dentro del cual se contienen todos los puntos del conjunto, y su sig- 
nificado tanto geográfico como geométrico es de gran utilidad en muchos aspectos. 



Figura 18.14: Contorno convexo mínimo. 

Resulta fácil visualizar el concepto de esta envolvente si suponemos que ro- 
deamos los puntos con una banda elástica. La forma que define dicha banda es 
la envolvente mínima convexa. Como puede verse en la figura 18.14, es sencillo 
trazar este polígono visualmente a partir de los puntos, pero su cálculo numérico 
es sumamente más complejo de implementar de lo que en apariencia puede pen- 
sarse. Los detalles acerca de algoritmos para el cálculo de esta envolvente pueden 
encontrarse, por ejemplo, en [3 19]. 

La envolvente convexa delimita el área dentro de la cual se puede inferir el 
comportamiento de una variable a partir de una serie de muestras. Por ejemplo, 
en el caso de interpolar un conjunto de valores tal y como vimos en el capítulo 13, 
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los valores estimados dentro de la envolvente convexa mínima son producto de una 
interpolación, mientras que estimar valores fuera de dicha envolvente constituye 
en realidad un proceso de extrapolación. 

El polígono que define a la envolvente mínima convexa puede ser empleado 
asimismo como dato de entrada para otras operaciones geométricas. Dados, por 
ejemplo una serie de puntos en los que ha aparecido una enfermedad infeccio- 
sa, puede calcularse la envolvente mínima convexa y a partir de ella calcular una 
zona de influencia con una distancia definida en función de la capacidad de pro- 
pagación de la enfermedad. El nuevo polígono resultante representa la región que 
puede verse afectada por dicha enfermedad. 

Una serie de envolventes convexas sucesivas sobre un conjunto de puntos forma 
una teselación en capas en forma de cebolla 1 , de utilidad para la realización de 
diversos análisis estadísticos sobre dichos puntos (Figura 18.15). 



Figura 18.15: Serie de contornos convexos formando una teselación en capas ( onion 
peeling) . 


18.6.2. Círculo mínimo 

El círculo mínimo es aquel circulo que contiene a todos los puntos de un 
conjunto dado con el menor radio posible (Figura 18.16) 

El significado de este círculo mínimo es variado, ya que tanto el centro como el 
radio del mismo se prestan a diversas interpretaciones. Por ejemplo, si suponemos 
un terreno plano y una serie de núcleos de población (cada uno de ellos representado 
por un punto) , y queremos situar una antena para dar cobertura a la región definida 
por esos puntos, el centro del círculo mínimo es una buena opción. Esto es así 
porque minimiza la distancia a la que se sitúa el punto más alejado, y por tanto 


1 Onion peeling, en inglés 
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Figura 18.16: Círculo de radio mínimo que engloba a una serie de puntos. 


minimizará la fuerza de la señal necesaria para ofrecer esa cobertura completa. La 
intensidad de la señal se puede calcular en función del radio del círculo. 

Un análisis similar es frecuente en el terreno militar. Para un conjunto de n pun- 
tos a atacar, el emplazamiento de una bomba en el centro del circulo mínimo permiti- 
rá que ese ataque afecte a todos los puntos con una cantidad mínima de explosivo. Di- 
cha cantidad está en relación, al igual que en el caso anterior, con el radio del círculo. 

La construcción de algún elemento de servicio compartido, tal como un colegio 
o un hospital también puede analizarse empleando el círculo mínimo. Si situamos 
dicho elemento en el centro, garantizamos que la distancia del usuario más lejano 
de dicho servicio es mínima. Cualquier otro emplazamiento implicaría que existe 
un usuario en peores condiciones, que tendrá que recorrer una distancia mayor 
para llegar a ese colegio u hospital. 

Como vemos, el círculo mínimo es una herramienta útil para la localización 
y emplazamiento de distintos elementos. Estos problemas, no obstante, son más 
complejos en general, ya que implican la localización de varios elementos, o bien 
existen otros previos que han de considerarse, así como diversos factores externos. 

Además de esta interpretación geográfica, el círculo mínimo aporta otro tipo de 
información. Es habitual, por ejemplo, que los puntos que se sitúan en el borde del 
mismo sean descartados, ya que constituyen los más alejados y en cierta medida 
son elementos extremos poco representativos del conjunto. 

Existen muchos algoritmos para el cálculo del círculo mínimo, que escapan al 
ámbito de este texto. Para saber más al respecto, puede consultarse [320] o [321], 

Es de reseñar que los punto situados en el borde del círculo mínimo siempre 
pertenecen a su vez a la envolvente mínima convexa. Por ello, el problema del cálculo 
del circulo mínimo para un conjunto de n puntos puede reducirse al cálculo de dicho 
círculo para el subconjunto de puntos que componen la envolvente mínima convexa. 
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18.6.3. Rectángulo mínimo 

El rectángulo mínimo es el rectángulo de menor área que cubre todos los puntos 
de un conjunto (Figura 18.17). 



Figura 18.17: Rectángulo mínimo que engloba a un conjunto de puntos. 

Pare el cálculo del rectángulo mínimo se aplica el hecho de que al menos un 
lado de este se sitúa sobre un lado de la envolvente mínima convexa. Por ello, basta 
comprobar los distintos rectángulos que pueden construirse sobre dicha envolvente, 
y tomar el de menor área. 

Generalmente, el rectángulo de menor área coincide con el de menor perímetro, 
pero no siempre es así. De cualquier modo, este último también cumple la condición 
citada con respecto a la envolvente convexa, por lo que su cálculo puede hacerse 
por un procedimiento idéntico. 

18.7. Generalización de líneas 

Como ya sabemos, toda la información vectorial la almacenamos en ultima 
instancia como un conjunto de puntos, ya sean aislados o unidos mediante segmen- 
tos o curvas para conformar líneas o contornos de polígonos. Una transformación 
habitual en el caso de líneas o polígonos consiste en la modificación de ese conjunto 
de puntos de tal modo que se reduzca su número pero se preserve en la medida 
de lo posible la información que originalmente contenían. 

Este proceso de simplificación es parte de la generalización de líneas, y es 
importante dentro de los Sistemas de Información Geográfica, tanto para la re- 
presentación de datos como para su análisis o su simple almacenamiento, como 
ya vimos al inicio de este libro. 

Las razones que por las cuales puede resultar de interés llevar a cabo un pro- 
ceso de generalización de líneas son diversas, y entre ellas cabe destacar las dos 
siguientes [29]. 
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■ Reducción del tamaño de los datos. Una reducción del número de pun- 
tos elimina puntos en muchos casos superfluos, de tal forma que la capa 
simplificada presenta la misma utilidad pero ocupa un espacio menor. 

■ Reducción del tiempo de proceso. La capa generalizada se maneja de 
forma más rápida en operaciones tales como la representación en pantalla, 
la impresión, o la realización de otros cálculos. En términos generales, todos 
los cálculos con la linea generalizada, como por ejemplo el trazado de una 
zona de influencia o de cualquier otro de los procesos vistos en este capítulo, 
se efectúan con un menor costo de proceso, ya que requieren el análisis de 
un menor número de puntos. Otros procesos tales como la conversión de esa 
capa en una capa ráster también experimentan una ganancia en rendimiento. 

En ocasiones, la simplificación puede implicar la reducción de elementos más 
allá de puntos aislados, tal y como operan los algoritmos que a continuación 
veremos. Eliminando puntos a lo largo de una línea puede lograrse el resultado 
buscado, reduciendo el detalle longitudinalmente, pero un cambio de escala pue- 
de también implicar la necesidad de eliminar no únicamente puntos, sino líneas 
completas. Por ejemplo, si una capa de líneas recoge con detalle una vía mediante 
dos líneas, una para cada borde de la misma, no tiene sentido emplear una capa 
de tal detalle para un mapa a una escala tal como, por ejemplo, 1:200000. En 
este caso, puede sustituirse el par de líneas anteriores por una única, ya que la 
variación en el resultado no será perceptible. La simplificación de las líneas en 
este caso debe operar sustituyendo dos líneas por una única. Si esa carretera 
queda recogida mediante un polígono, puede simplificarse mediante un proceso 
de «adelgazamiento» que convierta este en una línea central. La obtención de este 
eje del polígono se hace con un proceso que es similar a la zona de influencia hacia 
el interior de un polígono, la cual veíamos al principio de este mismo capítulo. 

Una operación también relacionada con la generalización de líneas es el sua- 
vizado. En muchas ocasiones, las líneas de una capa vectorial son excesivamente 
angulosas y no presentan un aspecto natural, muy distinto del trazo suave con 
que un cartógrafo trazaría las mismas al realizar un mapa. Alterando el conjunto 
de puntos de la línea de forma similar a lo visto anteriormente, puede lograrse 
un redondeo en las curvas definidas por este. Dicho redondeo puede buscarse con 
meros fines estéticos, pero también para eliminar variaciones bruscas o desviaciones 
locales, manteniendo tan solo la forma general de la linea. Este es, por ejemplo, 
el proceso que debe realizarse si deseamos utilizar las lineas a una escala de menor 
detalle que la que originalmente se empleó en su creación. 

El suavizado de líneas es también útil como preparación de datos de líneas 
procedentes de un proceso de digitalización. Aunque muchos elementos naturales 
tienen formas redondeadas, es habitual que el encargado de llevar a cabo esa 
digitalización genere elementos más angulosos que el objeto real que se digitaliza. 

Algo similar sucede cuando las operaciones de vectorización se realizan de 
forma automática, tales como las que vimos en en capítulo 17. El suavizado de 
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las líneas mejora en tal caso la calidad de estas, no solo en su aspecto estético, sino 
también en muchos casos su similitud con el objeto modelizado, pues se trata de 
formas más naturales (Figura 18.18). 



Figura 18.18: Suavizado de una línea procedente de vectorización a partir de una capa 
ráster. En negro, línea original con esquinas angulosas. En rojo, línea suavizada. 


18.7.1. Métodos 

Los algoritmos para la generalización de líneas son muy diversos y tienen 
cada uno sus propias características de precisión y rendimiento. La forma más 
simple de generalización consiste sencillamente en eliminar puntos sin considerar 
la relevancia de estos dentro de la línea. Esta eliminación puede realizarse de 
forma sistemática (eliminar un punto de cada n), o bien aleatoria. La magnitud 
del proceso de generalización se mide por el número total de puntos eliminados. 

No obstante, no todos los puntos de un línea tienen la misma importancia 
y aportan la misma cantidad de información. Algunos puntos pueden resultar 
redundantes, mientras que otros pueden ser cruciales para la forma del trazado. 
Como puede verse en la figura 18.19, eliminar algunos puntos puede no tener 
apenas efectos sobre la línea original o bien resultar en una variación drástica de 
su forma. Un mismo número de puntos eliminados puede dar lugar a lineas muy 
similares o muy distintas a la original, según sea el caso, por lo que esta medida 
de la simplificación no es una medida de cuan fidedigna es la linea resultante. 

Puesto que no todos los puntos deben ser considerados de igual modo, existen 
métodos de simplificación que consideran la naturaleza propia del punto dentro 
de la línea y estudian esta como entidad en su conjunto. Esto garantiza resultados 
mejores que con la mera eliminación sistemática de puntos intermedios. 

Podemos clasificar las rutinas de generalización de líneas en los siguientes 
bloques [322], 
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Figura 18.19: La eliminación de puntos de la linea original (a) puede dar lugar a líneas muy 
similares (b) o muy distintas (c), ya que no todos los puntos tienen la misma importancia. 


■ Rutinas de vecindad inmediata. Analizan cada punto y los inmedia- 
tamente anteriores y posteriores, estudiando los ángulos formados o las 
distancias. 

■ Rutinas de vecindad acotada. Estudian una serie de puntos vecinos, 
no necesariamente restringida a los inmediatos pero sí con algún umbral 
máximo de alejamiento o número de puntos. 

■ Rutinas de vecindad no acotada. Estudian los puntos vecinos y la región 
analizada depende de diversos factores, aunque no existe una dimensión 
máxima. 

■ Rutinas globales. Analizan la línea de forma global, no a nivel de los puntos 
que la componen. 

■ Rutinas que preservan la topología. Además de las propiedades geomé- 
tricas ya sea a nivel global o local, estudian la conectividad y topología del 
conjunto de líneas para garantizar que la línea simplificada preserva dichas 
propiedades. 

Uno de los algoritmos más habitualmente utilizados es el propuesto por[323], 
que pertenece al grupo de los globales. La intensidad del proceso de generalización 
se establece mediante un valor de tolerancia que indica la máxima desviación que 
se permite entre la línea original y la simplificada. 

En la figura 18.20 puede verse cómo una línea original se simplifica de diversas 
formas al aplicar tolerancias crecientes con este algoritmo. 

Respecto a los algoritmos de suavizado, estos pueden dividirse en tres grupos 
principales [322]: 

■ Media entre puntos. Se consideran un número n de puntos vecinos, y en 
base a ellos se calcula la nueva posición. 

■ Ajuste de funciones matemáticas. Ajustando funciones a los puntos 
que tengan un aspecto «suave», tales como splines o curvas Bézier. 

■ Tolerancias. Se establece una tolerancia y un umbral de precisión, y se 
ignoran los detalles a lo largo de la línea que salen de ese umbral. 

En [324] pueden encontrarse detallados métodos de todas las familias anteriores. 





Figura 18.20: Generalización de un conjunto de líneas (en trazo punteado) mediante 
el algoritmo de [323] para valores de tolerancia de 10 (a), 20 (b) y 50 metros (c). 

18.8. Resumen 

Las operaciones geométricas sobre entidades vectoriales constituyen en cierta 
forma el equivalente del álgebra de mapas ráster sobre las capas vectoriales. 

Las operaciones más importantes son el cálculo de zonas de influencia y las 
denominadas operaciones de solape, que permiten combinar capas de diversas 
formas. Entre estas encontramos las operaciones de intersección, unión, diferencia 
y recorte, así como el juntado de capas. Aunque producen transformaciones geo- 
métricas en las entidades de las capas de entrada, las tablas de valores asociadas 
deben considerarse y tratarse con precaución, pues dichas transformaciones pueden 
afectar a la validez de los datos que contienen. 

Las tablas pueden también usarse para definir otro tipo de operaciones tales 
como la disolución, en la que se unen regiones que comparten algún atributo común. 

Por último, las operaciones de generalización de líneas son útiles para disminuir 
el tamaño de los datos vectoriales, con las ventajas de manejo y proceso que ello 
conlleva. 



Capítulo 19 


Costes, distancias y áreas de influencia 


El concepto de distancia es básico para entender las relaciones espaciales. En este 
capitulo veremos la distancia como un caso particular de coste, y estudiaremos cómo aplicar 
la información de costes unitarios — en cada celda — para calcular costes acumulados entre 
celdas de destino y origen establecidas. 

Estudiaremos las capas que contienen los costes unitarios y acumulados, y sobre estas 
últimas calcularemos rutas óptimas que nos indiquen el camino a seguir para ir de un 
punto a otro con el menor coste posible. Estas rutas serán rectilíneas en caso de emplear 
la distancia euclídea como coste, pero no así en caso de emplear otro parámetro. 

Aplicando conceptos relacionados con los anteriores, calcularemos zonas de influencia 
sobre capas ráster con un enfoque distinto y más flexible que el que veíamos en el caso 
vectorial. 

El álgebra de mapas será la base de herramientas a utilizar, por lo que, una vez más, 
lo que necesitas para seguir el capítulo es un buen conocimiento de sus conceptos y una 
buena comprensión de las particularidades del modelo ráster, sobre el cual trabajaremos. 
Al final del capítulo, trabajaremos con datos vectoriales para el análisis de redes, con lo que 
deberás conocer asimismo los conceptos fundamentales relativos a la topología de estas. 


19.1. Introducción 

Desplazarse entre dos puntos cualesquiera del espacio implica un coste. Cuanto 
más alejados se encuentren estos, llevará más tiempo efectuar ese desplazamiento 
y se consumirá más energía, entre otras cosas. La distancia como tal, así como el 
tiempo o la energía gastada, son ejemplos de variables de coste. 

Un coste expresa la resistencia ofrecida por el medio para desplazarse a través 
de él en un punto concreto. 

El análisis de capas que contengan variables de este tipo nos permite calcular 
los costes globales de desplazarse a lo largo de toda la extensión de la capa, así 
como evaluar la mejor forma de hacerlo para minimizar dicho coste. 

Las variables que podemos utilizar como coste son muy diversas, y este tipo 
de análisis es de gran utilidad para todos aquellos procesos que impliquen algún 
tipo de movimiento. 

De este modo, el concepto de distancia puede «ampliarse», y con él todas sus 
implicaciones. Por ejemplo, las zonas de influencia no solo pueden definirse con 
la mera distancia euclídea, sino en base a otros factores. Así, podemos incorporar 
el hecho de que, mediando la misma distancia entre una celda y un conjunto de 
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otras dadas, la facilidad de recorrer esta distancia sea diferente, y por tanto no 
ejerzan todas la misma influencia sobre la primera. 

La delimitación de zonas de influencia sobre una base ráster permite no solo 
introducir estas ideas, sino también aportar más flexibilidad al proceso, pudiendo 
emplearse parámetros adicionales que condicionen la forma de llevarlo a cabo en 
cada punto. 


19.2. Superficies de fricción 

Una capa conteniendo una variable de coste se conoce como superficie de 
fricción. Las variables de coste son de tipo cuantitativo y generalmente, aunque 
no siempre, continuas. 

El valor de cada celda de una superficie de fricción indica el coste que supone 
recorrer dicha celda [325] . Puesto que la celda puede recorrerse en diversas direc- 
ciones, se establece que este coste se refiere a hacerlo en la dirección vertical u 
horizontal, no diagonal. Así, una capa que almacene la variable de coste «distancia» 
será una capa constante que contendrá en todas las celdas el tamaño de celda As. 

Por regla general, los costes son, no obstante, variables, esto es, distintos en 
cada celda. Veamos algunos casos. 

Una capa de pendientes, por ejemplo, es una capa de coste válida, ya que la 
dificultad de desplazarse sobre el terreno aumenta conforme lo hace la pendiente. 
De igual modo, el tiempo empleado en atravesar una celda, que será función de 
diversos factores, también representa un coste. 

Una superficie de fricción puede contener también un valor que no exprese 
directamente un coste, pero esté relacionado con él y permita obtenerlo. Por 
ejemplo, la velocidad media de tránsito a través de una celda. Con este valor y el 
tamaño de celda se puede obtener el tiempo de tránsito. 

El coste no es necesariamente una variable física de tipo continuo. Por ejemplo, 
podemos clasificar las distintas zonas de una capa en función de su atractivo 
visual. Invirtiendo estos valores obtenemos una variable de coste, que nos indica 
la «dificultad» de atravesar la celda en función de su atractivo. Las zonas con 
menor belleza suponen un mayor coste. Esto nos puede servir para calcular rutas 
agradables, ya que las rutas óptimas en este caso son aquellas que pasan por un 
menor numero de zonas estéticamente no agradables. 

Este tipo de variables hacen referencia a los denominados espacios subjeti- 
vos [326], en contraposición a los espacios absolutos sobre los que se registran 
las medidas de distancia o tiempo que constituyen las fricciones empleadas más 
frecuentemente . 

Aunque la capa con la superficie de fricción cubre toda una extensión dada, 
es probable que puntos de esta extensión no sean transitables. Si suponemos que 
el coste viene expresado por la pendiente, hay zonas tales como embalses donde, 
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con independencia de su pendiente, no podemos cruzar. Una solución habitual es 
asignar a las celdas en estas zonas un valor muy elevado (coste infinito), que haga 
que no sea viable transitarlas. No obstante, una opción más correcta es asignar 
valor de sin datos a estas zonas, de forma que queden directamente excluidas del 
cálculo. Esto puede emplearse para excluir en el posterior trazado de rutas óptimas 
aquellos puntos que no deseen ser transitados, bien sea por los propios valores de 
la variable de coste o bien por otras razones. 
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Figura 19.1: Una superficie de fricción permite calcular el coste de una ruta definida 
sobre ella. 

Un ejercicio sencillo para comenzar a trabajar con superficies de fricción es el 
mostrado en la figura 19.1. Sobre la pequeña capa ráster de la figura con valores 
de fricción, se representa una ruta entre dos de sus celdas. Podemos calcular 
el coste total de recorrer la ruta sumando los costes de cada movimiento entre 
celdas consecutivas. Para los desplazamientos en dirección horizontal o vertical, 
el desplazamiento tiene un coste dado por la expresión: 


c 


Cl+C 2 

2 


(19.2.1) 


siendo ci y C 2 las fricciones respectivas de las celdas entre las cuales se produce 
el desplazamiento. 

Si nos movemos en dirección diagonal, el coste que este movimiento supone es 


c=sj 2^±Á^ (19.2.2) 

Con lo anterior, el coste de la ruta señalada en la figura 19.1, comenzando en 
la celda de la esquina superior izquierda, es igual a 

1 3 3\/2 2yjí 2 2 2 1 

1 1 1 1 1 1 1 

22 2 2 2222 
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19.3. Superficies de coste acumulado 

Aunque de interés, el análisis anterior es muy simple, y no revela todo el 
potencial de la superficie de fricción. Mediante un análisis más intenso, podemos, 
por ejemplo, y dados los mismos puntos, calcular la ruta que haga mínimo el coste 
total de desplazamiento. 

De igual modo, el análisis de la superficie de fricción es la base para resolver otros 
problemas de rutas óptima. Dada una serie de puntos posibles de destino y un punto 
de inicio, podemos calcular cuál es el punto más cercano (cercanía en términos de 
coste mínimo, no de distancia euclídea), y calcular la ruta óptima y el coste de esta. 

Para ello, debemos convertir la capa con los costes unitarios por celda en una 
capa de coste acumulado. El coste acumulado de cada celda representa el valor del 
coste total a recorrer desde dicha celda a la celda de destino más cercana, despla- 
zándose por la ruta óptima. Para una superficie de fricción con distancias euclídeas, 
y un conjunto de n puntos, la capa de coste acumulado correspondiente indica la 
distancia al punto más cercano. Si utilizamos una superficie de fricción con tiempos 
de tránsito, la capa de coste acumulado indica el tiempo mínimo que se tardaría 
en alcanzar uno de esos puntos de destino (el más cercano en términos de tiempo) . 

De forma habitual, los puntos de destino se recogen en otra capa ráster, codifi- 
cados con un valor concreto, o bien simplemente con valores cualesquiera y valores 
de sin datos en las celdas que no representan puntos de destino. 

Para convertir una superficie de fricción en una superficie de coste acumulado en 
base a unos puntos de destino dados, se sigue el siguiente procedimiento [217, 327] : 

■ Para cada una de las celdas de destino, analizamos el coste de desplazarse 
a las adyacentes. 

■ Si estas no han sido analizadas aún o ya tienen un coste asignado pero es 
mayor que el calculado, se les asigna el valor de dicho coste calculado. 

■ Desde este punto, repetimos el proceso pero en lugar de utilizar las celdas de 
destino, utilizando todas las celdas que han sido modificadas en la iteración 
anterior. 

■ El proceso se detiene cuando no se modifican nuevas celdas, ya que en este 
punto todas tienen asignado su coste acumulado mínimo. 

Para visualizar gráficamente esta metodología, puede observarse que el proceso 
de ir seleccionando las celdas de análisis de cada iteración se asemeja a la propa- 
gación de las ondas al arrojar una piedra en un estanque, a partir de las celdas de 
destino iniciales que serían como el punto en el que cae la piedra. Contrariamente 
a lo que puede pensarse, a mayor numero de puntos de destino, menor tiempo 
de ejecución del algoritmo, de la misma forma que a mayor numero de piedras 
lanzadas sobre el estanque, menor tiempo tarda toda la superficie del mismo en 
ser alcanzada por alguna perturbación. 

En la figura 19.2 podemos ver la capa de coste acumulado resultante de utilizar 
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tres puntos de destino y una superficie de fricción constante. Puesto que la superficie 
de fricción es constante, dicho coste acumulado es proporcional a la distancia. 



Figura 19.2: Capa de coste acumulado para tres puntos de destino y con una superficie 
de fricción constante. Para lograr una visualización más explícita se ha añadido un 
sombreado en función del propio coste. 

Para calcular la superficie de coste acumulado necesitamos puntos de destino, 
codificados según algún criterio preestablecido, como ya se ha dicho.. Puesto que 
trabajamos sobre una capa ráster, en realidad debemos definir celdas de destino. 
Estas, no obstante, no han de representar necesariamente localizaciones puntuales 
aisladas. Podemos establecer grupos de celdas de destino contiguas, que en realidad 
representan áreas de destinol9.3. Esto nos permite recoger entidades lineales (por 
ejemplo, para calculo de costes de desplazamiento a una carretera) o de área, 
además de, por supuesto, elementos puntuales 

Uno de los problemas principales del cálculo con el método anterior es el debido 
a la limitación de los ángulos de movimiento. Al igual que veíamos para el modelo 
D8 de flujo, el hecho de que los movimientos se analicen en la ventana 3x3 obliga 
a que la dirección sea una de las definidas por las ocho celdas circundantes, es 
decir, siempre un múltiplo de 45°. Observando la figura 19.3, no es difícil percibir 
el efecto de esta limitación, del mismo modo que era sencillo detectar visualmente 
las deficiencias del modelo D8. Este efecto es especialmente patente al emplear 
una superficie de coste constante, tal y como se ha hecho en la figura anterior. 

Para solventar en parte este inconveniente, una opción es analizar no solo esas 
ocho celdas, sino también algunas de la ventana 5x5 centrada en la misma celda. 
En particular, aquellas situadas a salto de caballo desde la celda central, por lo 
que esta conectividad se conoce como vecindad, de caballo, en contraposición a la 
vecindad de reina que define el conjunto de celdas contiguas en la ventana 3x3 
[328]. La figura 19.4 muestra esquemas de ambos tipos de vecindad. 
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Figura 19.3: Superficie de coste acumulado representando el coste mínimo a un área 
de destino. Las celdas en blanco indican las celdas de destino, para las cuales el coste 
acumulado es nulo. 



Figura 19.4: Tipos de vecindad, a) de caballo, b) de reina. 

19.3.1. Coste isotrópico vs coste anisotrópico 

Al introducir el análisis de las superficies de fricción señalábamos la pendiente 
como una posible variable de coste. Los costes de un desplazamiento dependían de 
ese valor de la pendiente, así como de la dirección de desplazamiento, para aplicar 
el factor de corrección \/2 s en caso de hacerlo diagonalmente. No obstante, además 
de considerar la dirección de desplazamiento para aplicar esa corrección en función 
de la distancia entre centros de celda, para modelizar el proceso de forma realista 
debemos considerarlo junto a la propia naturaleza de la variable de coste. En el 
caso de la pendiente, resulta obvio que no es igual recorrer la celda ascendiendo 
por la línea de máxima pendiente que hacerlo por la dirección de la curva de nivel. 
Es decir, el valor de coste en las celdas de una superficie de fricción no es único, 
sino que depende de la dirección. 

Frente al coste isotrópico (igual en todas las direcciones) que hemos visto hasta 
el momento, más fácil de modelizar y comprender, encontramos fenómenos en los 
que la resistencia del medio no es la misma en todas direcciones. Este coste es de 
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tipo anisotrópico. Junto al caso de la pendiente, otro ejemplo claro de esto es, por 
ejemplo, la resistencia que el viento ofrece al movimiento. Si usamos como coste 
el tiempo que se tarda en atravesar cada celda, y este tiempo lo calculamos según 
la velocidad máxima a la que podamos desplazarnos, es obvio que esta velocidad 
máxima no será la misma si vamos en contra del viento que si vamos a favor. En 
general, la mayoría de procesos son de tipo anisotrópico, aunque muchos de ellos 
pueden simplificarse y estudiarse como procesos isotrópicos. 

El concepto de superficie de fricción debe extenderse para acomodar este nuevo 
tipo de modelos. La capa con valores unitarios no es suficiente, ya que estos reflejan 
únicamente el coste en una dirección de todas las posibles. La solución habitual 
es recoger en la superficie de fricción los valores de coste máximo (el que se tendría 
desplazándose en contra del viento o hacia arriba de la ladera por la línea de 
máxima pendiente) , y acompañar esta de una capa adicional con las direcciones en 
las que dicho coste máximo se produce. En el caso de la pendiente, esta dirección la 
podríamos obtener con la orientación en la celda, y en el caso del viento tomando 
la dirección opuesta a aquella en la que este sopla en cada celda. 

Junto a esto, se define una función que, en base a la desviación angular respecto 
a la dirección de máximo coste, permite calcular los costes unitarios (fricción 
efectiva) en cualquier dirección. Con estos elementos ya podemos trabajar sobre 
la capa, estudiar el coste de una ruta concreta entre dos puntos, o crear una capa 
de coste acumulado de la misma manera que antes lo hacíamos con una capa de 
coste unitario isotrópico. 

Una posible forma para la función anterior es la siguiente: 

cicos fc (ai) +C 2 Cos fc (a 2 ) 

' “ 2 

donde a\ y «2 son las diferencias entre el ángulo en que se produce el movimiento 
y los ángulos de máximo coste de las celdas, y k una constante. 

Pueden adaptarse formulaciones más específicas si se conoce cómo modelizar un 
tipo de movimiento dado. Por ejemplo, la velocidad de propagación del fuego, cono- 
cida la velocidad en la dirección de máxima propagación, puede calcularse para las 
restantes según ciertas expresiones derivadas del análisis y modelización del fuego. 

Dados los focos de un incendio, puede calcularse así el tiempo que tardarán 
en quemar toda el área definida por la superficie de fricción. En este caso, debe 
considerarse que los puntos no son de destino, sino de partida, con lo que la dirección 
a considerar es la opuesta. El trayecto cuyo coste se representa en la capa de coste 
acumulado no es para dicha celda hasta el foco más cercano, sino desde este. 

El caso presentado de la pendiente como factor que condiciona el desplaza- 
miento a pie puede expresarse con más precisión según la siguiente ecuación [329]: 


(19.3.1) 


T=aAS+bAH 1 +cAH 2 +dAH 3 


(19.3.2) 
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siendo T el tiempo empleado en el recorrido, AS la distancia recorrida, AH\ la 
distancia vertical recorrida cuesta arriba, A Ho la distancia vertical recorrida cuesta 
abajo con pendiente moderada y AH 3 la distancia vertical recorrida cuesta abajo 
en pendiente pronunciada. La pendiente moderada va de 5°a 12°y la pronunciada 
es aquella con ángulo mayor de 12°. Los valores propuestos de las constantes son 
[329] a = 0,72,6=6,0,c= 1,9998, d= -1,9998. 

Calculando la pendiente existente entre dos celdas entre las que se analice el 
coste, podemos así estimar el tiempo empleado. 

En ocasiones, el movimiento no es posible en todas las direcciones. Es decir, en 
ciertas direcciones el coste es infinito. Por ejemplo, en el caso de modelizar el movi- 
miento de un flujo aplicando un algoritmo como el D8 como veíamos en 15.6.1. De las 
ocho celdas hacia las que puede darse el movimiento, solo una de ellas es posible. Las 
restantes tendrían un coste infinito, pues el movimiento en esa dirección es inviable. 

Aplicando este concepto es posible calcular una capa de distancias a un cauce, 
pero que esta distancia no sea euclídea, sino la seguida por el flujo desde cada 
punto hasta el punto en el que se unen con dicho cauce. Las celdas de cauce son 
en este caso las celdas de destino. 

La figura 19.5 muestra un mapa de distancia euclídea a un cauce, así como 
otro de distancia hidrológica, pudiendo apreciarse la diferencia entre ambas. 



Figura 19.5: a) Distancia euclídea al cauce, b) distancia hidrológica al cauce. 

Un problema adicional de trabajar con superficies de fricción anisotrópicas es 
la combinación de varias fuerzas resistentes. 

Si las superficies de fricción son isotrópicas, y son varios los factores que di- 
ficultan el desplazamiento, combinar estos es tan sencillo como sumar las capas 
correspondientes. Si la influencia no es equivalente, pueden normalizarse o bien 
ponderarse, pero la capa resultante se obtiene con una mera suma y sigue siendo 
una superficie de fricción isotrópica. 

Consideremos ahora el caso de dos variables de coste anisotrópico tales como el 
viento y la pendiente. En este supuesto no podemos sumarlas, ya que es necesario 
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considerar también las direcciones de coste máximo. Sólo si estas fuesen idénticas po- 
dríamos sumarlas y obtener una nueva superficie de fricción, que utilizaríamos con 
la capa de direcciones de máximo coste de cualquiera de ellas. Este caso, no obstante, 
es altamente improbable. Incluso puede darse que en un punto el coste máximo de un 
factor coincida con el mínimo de otro, por ejemplo si el viento sopla pendiente arriba. 

El problema estriba en la capa de direcciones, que por contener un parámetro 
circular tal como se vio al tratar la orientación en 15.5.1, no pueden utilizarse las 
operaciones aritméticas y estadísticas de la forma habitual. Este caso es similar 
a lo visto en 12.3. 

Al igual que lo visto entonces, la forma de proceder en este caso en considerar 
el binomio coste-dirección (c,/3) como un vector y convertirlo en sus componentes 
en los ejes cartesianos (x,y) según las expresiones 

x = c-cos/3 ; y = c-sin/3 (19.3.3) 

Las componentes de cada variable de coste sobre los ejes x e y ya pueden 
sumarse para obtener dos capas con la componente del coste total en cada eje. 
Con estas dos capas puede obtenerse el par de capas resultantes con coste máximo 
y dirección de máxima fricción, aplicando las expresiones 

c= x 2 +y 2 ; /3 = tan— (19.3.4) 

Estas ya pueden utilizarse para obtener superficies de coste acumulado de la 
forma antes detallada. 

19.4. Cálculo de rutas óptimas 

El valor de cada celda en una capa de coste acumulado nos indica el coste 
mínimo para alcanzar una de las celdas de destino, pero no nos informa de la ruta 
que implica dicho coste. No obstante, no es difícil calcular dicha ruta. 

Para entender mejor la forma de llevar esto a cabo, resulta de interés representar 
la capa de coste acumulado con una vista tridimensional, empleando el coste como 
elevación. Visualizar así esta superficie es una forma muy intuitiva de ver lo que 
representa y cómo utilizarla. La figura 19.6 muestra la capa de coste acumulado, 
así como una ruta óptima. Se ve que la superficie contiene tantos sumideros como 
puntos de destino. Estas son las zonas de mínimo coste (coste cero, ya que son los 
propios puntos de destino), que aparecen con mínima elevación. La ruta va desde 
el punto de origen hasta el fondo de uno de dichos sumideros. 

La superficie de coste acumulado es en realidad una superficie de potencial, y 
el desplazamiento entre el punto de origen y el de destino se asemeja mucho, como 
puede verse en la figura, a la ruta que seguiría un flujo desplazándose hacia aguas 
abajo si en lugar de coste acumulado fuera elevación el parámetro recogido en la 
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Figura 19.6: Representación tridimensional de una capa de coste acumulado y una ruta 
óptima sobre esta. 


capa. Por tanto podemos utilizar modelos de dirección similares a los mostrados 
para el caso del análisis hidrológico (15.6.1). En particular, un modelo sencillo 
como el D8 en el que el flujo se desplaza hacia la máxima pendiente. 

Por la propia forma en la que se construye la superficie de coste acumulado, 
no existen sumideros aparte de las propias celdas de destino, y siempre existe 
una celda de menor valor alrededor de cualquier otra, excepto en dichas celdas 
de destino, que son mínimos absolutos. 


19.5. Zonas de influencia 

Como ya sabemos visto, los objetos geográficos tiene influencia sobre su en- 
torno. Un elemento lineal como un río, o uno puntual como una estación de metro 
presentan una funcionalidad o un comportamiento respecto a su entorno que 
depende de la distancia. 

A lo largo de este capítulo hemos visto que la distancia puede interpretarse 
como un tipo de coste. Por ello, podemos utilizar otras variables de la misma forma 
que la distancia para definir zonas de influencia. 

Al hacerlo, podemos crear zonas de influencia de dimensión fija, tales como las 
creadas en forma vectorial según vimos en 18.2, o, por el contrario, de dimensión 
variable. Las de dimensión fija pueden tener formas irregulares alrededor del objeto 
central, ya que esa dimensión ya no es necesariamente en términos de distancia, 
sino de coste. Cumplen, no obstante, la condición de que todas las celdas en el borde 
de la zona tiene un mismo valor de coste (del mismo modo que, si empleamos la 
distancia euclídea, todos los puntos en el límite se encuentran a la misma distancia 
del objeto central. 

En las de dimensión variable, la dimensión de la zona de influencia varía según 
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cada celda de las que conforman el objeto, teniendo cada una una capacidad 
distinta de ejercer su influencia sobre el medio circundante. 

Frente al cálculo de zonas de influencia que vimos para las capas vectoriales, la di- 
ferencia estriba en que en este caso no se trata de una operación geométrica, y de que 
la zona no es «exacta» , pues su forma y precisión depende de la resolución de celda. 

19.5.1. Zonas de influencia de dimensión fija 

Para comenzar, la figura 19.7 muestra una comparación entre la zona de 
influencia calculada sobre el trazado del cauce recogido según un modelo vectorial y 
la misma zona calculada sobre una base ráster. Para calcular esta última se ha creado 
la capa de coste acumulado tomando el cauce como conjunto de celdas de destino, 
pero deteniéndose el algoritmo una vez que se alcanza un umbral de distancia dado. 
También puede calcularse de la forma habitual, y después reclasificando todas 
aquellas celdas con distancia mayor que el umbral para asignarles valor de sin datos. 


Tí 

Figura 19.7: Comparación entre a) zona de influencia en formato vectorial y b) zona 
de influencia en formato ráster. 

La primera diferencia apreciable es que la zona de influencia en el caso ráster 
viene limitada a la capa de entrada en la que se contienen las entidades. En general 
los SIG operan de este modo, y al efectuar un proceso de álgebra de mapas la 
salida ráster coincide en dimensiones y tamaño de celda con la entrada. En el 
caso vectorial no existe restricción espacial alguna, y la zona de influencia puede 
«crecer» más allá de los límites de la capa de entrada. 

Una segunda diferencia la encontramos en el hecho de que, además del límite 
de la zona de influencia, cuando esta se calcula en formato ráster existe además 
información en el interior de la misma. Dicha información puede servirnos para 
cuantificar la influencia existente dentro del área definida. Nótese en este sentido 
que la influencia es, por regla general, inversamente proporcional al coste, ya 
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que cuanto más costoso sea llegar a una zona desde un punto de destino, menos 
influencia existirá del uno sobre el otro, así como del otro sobre el uno. 

Por otra parte, este mismo proceso lo podemos realizar utilizando otras super- 
ficies de fricción, sean isotrópicas o anisotrópicas, sin estar limitados al caso de 
la distancia euclídea. En el caso vectorial, este cálculo no es posible desarrollarlo, 
ya que se trata de un proceso meramente geométrico sin el concurso de capas 
adicionales de fricción. Por ejemplo, la figura 19.8 muestra la misma zona de 
influencia anterior, con la misma distancia máxima, pero en este caso se trata de 
una distancia hidrológica en lugar de una euclídea. 



Figura 19.8: Zona de influencia de un cauce basada en distancia hidrológica. 

Otro ejemplo lo encontramos en la figura 19.9, la cual representa el espacio que 
se supone ocupado por una determinada especie. A partir de tres puntos donde 
se ha detectado la presencia de dicha especie, asignando por simplicidad un coste 
constante a las zonas circundantes en función de su vegetación, y estimando un 
coste máximo a superar por un individuo de dicha especie en una jornada, se 
calcula la superficie de coste acumulado y se delimita la zona de influencia. Fuera 
de esta, es improbable encontrar individuos. 

Este análisis puede realizarse de forma similar con datos vectoriales, pero en 
ese caso se dispone únicamente de dos clases: o el punto esta dentro de la zona de 
influencia o no. En el caso ráster, no obstante, tenemos una medida de la distancia 
en cada celda, que sin duda es también una medida de la probabilidad de encontrar 
un individuo, ya que resulta lógico pensar que en los puntos más cerca del borde 
la probabilidad es menor que en puntos más centrales. 

Pueden calcularse también las zonas de influencia de una manera similar a la 
vectorial, únicamente delimitando el contorno en función de la distancia euclídea 


Costes, distancias y áreas de influencia 


523 



Figura 19.9: Zona de influencia de una especie dada su área de residencia y un coste 
máximo de desplazamiento. 

y sin aplicar los conceptos de creación de capas de coste acumulado. En este caso 
basta tomar todas aquellas celdas que constituyen los objetos centrales (las celdas 
de destino en el caso del análisis de coste) y marcar con un valor establecido las 
celdas circundantes a una distancia menor que la distancia de influencia escogida. 
Se trataría de un análisis focal con una ventana de análisis circular de radio igual 
a la distancia de influencia, en la que los valores dentro de esta reciben todos el 
mismo valor. Obviamente, los resultados que pueden obtenerse de este modo son 
más limitados que aplicando toda la potencia del análisis de costes. 

19.5.2. Zonas de influencia de dimensión variable 

Al realizar el cálculo de una zona de influencia de dimensión fija, establecemos 
un umbral de coste acumulado, a partir del cual consideramos que no existe tal 
influencia. Todos los elementos en el limite del área delimitada tienen el mismo 
valor de coste acumulado. En ocasiones, no obstante, lo interesante para definir 
la influencia de un elemento geográfico puede no ser el coste acumulado desde el 
mismo a las celdas del entorno, sino el propio coste unitario de dichas celdas, o 
bien otro valor asociado a las mismas, no necesariamente un coste. 

Con estos planteamientos podemos definir zonas de influencia de dimensión 
variable, en las cuales las celdas fronterizas no cumplen ningún requisito relativo 
al coste acumulado que se da en las mismas. 

Para ver un primer ejemplo considérese el siguiente supuesto: se dispone de 
una carretera y una capa de pendientes. Por la carretera los vehículos circulan sin 
dificultad, y fuera de ella, los vehículos todo-terreno pueden hacerlo siempre que 
la pendiente no sea superior al 5%. Tratemos de calcular la zona de influencia de 
la carretera, es decir, la zona que es accesible con un vehículo todo terreno. 

Podemos abordar el problema como un problema de costes habitual. Tomando 
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la superficie de fricción, reclasificamos todos los valores por encima de nuestro 
umbral del 5% y les asignamos valor de sin datos para indicar que no son transita- 
bles. Después, calculamos la superficie de coste acumulado, tomando las celdas de 
carretera como celdas de destino (Figura 19.10). No todas las celdas con pendiente 
inferior al 5% forman parte del área de influencia, ya que, aunque el vehículo puede 
transitarlas, algunas no puede alcanzarlas, y quedan como «islas». 

El modelo de coste, pese a incluir la pendiente, es en esta ocasión isotrópico, ya 
que el vehículo no puede desplazarse por zonas con pendiente superior al umbral, 
con independencia de la dirección en la que lo haga. 



Figura 19.10: Zona de influencia (en azul) de una vía (en rojo) , suponiendo que es 
posible el desplazamiento desde esta siempre que la pendiente no supere el 5%. En el 
fondo, mapa de pendientes. Tonalidades más oscuras indican mayor pendiente. 

Asimismo, no es necesario aplicar ningún umbral a esta capa de coste acumu- 
lado, ya que no es ese parámetro el que define la zona de influencia. Si la carretera 
esta rodeada a ambos lados por zonas completamente llanas, la zona de influencia 
se extenderá indefinidamente, ya que el coste acumulado no es relevante en este 
caso. Lo utilizamos simplemente para incorporar la conectividad de las distintas 
celdas transitables con la vía central. Es por ello que el mapa de la figura 19.10 solo 
marca la zona de influencia sin incorporar los valores interiores de coste acumulado 
(en este caso pendiente acumulada), ya que no son de interés. 

Podemos añadir más complejidad al modelo utilizando un umbral variable. 
Por ejemplo, sea un cauce del cual conocemos, en cada una de sus celdas el valor 
de su calado en un evento extremo. El cauce viene definido como una estructura 
lineal de una única celda de ancho, pero con estos datos vamos a tratar definir el 
área realmente ocupada por el agua en ese evento. Esto es, el área de inundación. 

Modelizar hidráulicamente un cauce en un supuesto como el presentado es 
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mucho más complejo que lo que vamos a ver, y se requieren más datos, pero 
podemos plantear una primera aproximación al estudio de ese área de inundación, 
pues no deja de ser una zona de influencia. 

Si en el caso del vehículo teníamos un umbral fijo, ahora este umbral es variable 
y depende del calado. Como muestra la figura 19.11, para una elevación z en la 
celda de cauce y un calado h, el agua podrá inundar aquellas celdas contiguas con 
elevación menor que z+h. Si tomamos la capa de calado y le sumamos el MDE, 
tendremos una capa de cauces en las que sus celdas representan los puntos de 
destino 1 , y además cada una de ellas contiene el valor de umbral. Es decir, que 
al operar según se explicó anteriormente para crear la capa de coste acumulado, 
el umbral dependerá de la celda concreta desde la que nos venimos desplazando. 
Las celdas por debajo del umbral son viables, mientras que las superiores, no. Este 
modelo es similar al que planteábamos al analizar la distancia hidrológica, solo 
que en este caso el umbral que aplicamos no es sobre el coste acumulado, sino que 
lo usamos para calcular en cada celda los costes unitarios. Para aquellas celdas 
que superan dicho umbral, el coste es infinito. Para las restantes, nulo. 



Figura 19.11: El calado h define la inundabilidad de las zonas circundantes al cauce, 
en función de la elevación de estas. En rojo, celda central del cauce. 


19.6. Influencia acumulada 

En los anteriores ejemplos, delimitamos la influencia de un elemento geográfico 
a un entorno de este, y en algunos casos cuantificamos esta. Si el objeto geográfico 
se compone de varias celdas, por la propia naturaleza del algoritmo, solo será la 
más cercana la que tenga influencia en el valor final de coste acumulado de otra 
celda dada. Esto, que resulta correcto para el cálculo de rutas óptimas, no lo es 
tanto cuando queremos considerar simultáneamente todas las celdas de destino 
(o de influencia, según sea el enfoque). 

x Si asumimos que las celdas sin calado (aquellas que estén fuera de cauce) tienen un valor de 
sin datos, al sumar las dos capas, y como se dijo en 14.2.2, todas estas celdas tendrán valor de sin 
datos en la capa resultante, independientemente del valor de elevación que tengan en el MDE. 

Por ello, esta nueva capa también nos servirá como capa puntos de destino según la codificación 
habitual 
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Supongamos que existen núcleos de población cercanos al cauce, cada uno de 
los cuales tiene una población dada. Si desde estos núcleos la población va hacia el 
río a practicar la pesca, la influencia de esta actividad sobre cada celda del cauce 
dependerá de todas las poblaciones cercanas. Dependerá, asimismo, de la distancia 
o coste de desplazamiento desde las mismas y de la población de estas. 

Calcular una capa de coste acumulado utilizando todas las ciudades no sirve 
en este caso para evaluar su influencia sobre las distintos tramos del cauce. Si 
tomamos un coste máximo, podemos delimitar una zona de influencia y ver qué 
zonas del cauce no se ven afectadas. Para las restantes, sin embargo, la influencia 
es distinta, y la información de que disponemos en esa capa de coste acumulado no 
refleja la verdadera influencia del conjunto de ciudades. No obstante, los elementos 
del análisis de costes sí que nos sirven para, aplicándolos de un modo distinto, 
obtener el resultado buscado. 

En 13.3 suponíamos que la zona de influencia para el cálculo de densidades 
era circular, llevando esto implícito que el coste utilizado era la distancia. Ahora 
conocemos el modo de emplear otras variables de coste y, siendo similar el cálculo 
de densidades (o probabilidades) al de influencias, podemos proceder de forma 
similar a lo explicado entonces, operando con las capas de costes asociadas a cada 
punto de influencia. He aquí la manera de hacerlo: 

■ Calculamos la superficie de coste acumulado empleando una única ciudad 
como destino. 

■ Con la capa anterior, creamos una capa de influencia de dicha ciudad sobre 
su entorno. La influencia en este caso es inversamente proporcional al coste, 
así que podemos sencillamente invertir sus valores o aplicar otra función más 
compleja que relacione ambas variables. 

■ Repetimos el anterior proceso para cada una de las ciudades. Obtendremos 
tantas capas de influencia como ciudades existan. 

■ Sumamos las capas anteriores para obtener la influencia del conjunto de 
ciudades en cada celda. 

■ Puesto que estamos estudiando la influencia de la práctica de la pesca, apli- 
camos una máscara para que la capa anterior quede restringida a las zonas 
donde esta pueda desarrollarse, es decir, los cauces. 


19.7. Análisis de redes 

Todo el análisis de costes lo hemos realizado hasta este punto sobre una base 
ráster. Esta es la manera más ventajosa y adecuada de llevarlo a cabo, pues 
trabajamos con superficies de tipo continuo (las superficies de fricción), que se 
analizan mejor bajo este modelo de representación. 

Un caso particular del análisis de costes es el análisis del movimiento a través 
de una red, siendo el caso más habitual en un SIG el de una red viaria. El calculo 
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de la ruta de menor coste entre dos nodos de dicha red es un problema típico que 
tiene numerosas aplicaciones incluso fuera del ámbito geográfico, y constituye una 
aproximación diferente a la que ya conocemos para el caso ráster. 

En el supuesto de un desplazamiento por una red viaria, la división del terreno 
en unidades regulares que implica el modelo ráster no es adecuada, y resulta mucho 
más lógico un modelo vectorial que contenga las vías y los emplazamientos entre los 
que estas se sitúan, recogiendo igualmente la topología de la red. Esta estructura 
es óptima no solo para el almacenamiento y manejo, sino también para el análisis 
de costes, como a continuación veremos. 

El análisis de costes ráster tal como lo hemos visto permite modelizar los costes a 
través de vías y el movimiento restringido a estas. Basta excluir las celdas fuera de las 
vías (asignándoles coste infinito o valores de sin datos) y operar de la forma habitual. 
No obstante, el hecho de que exista dicha restricción (al analizar un coste de 
desplazamiento por vías, no podemos abandonar estas) , favorece la utilización de un 
modelo vectorial para estos casos, haciendo que resulte más lógico. Otros elementos 
de la vía, como el hecho de que algunas de ellas puedan recorrerse únicamente en 
una dirección, se recogen mejor mediante un modelo de representación vectorial, 
como ya vimos en el capítulo 5 al introducir el concepto de topología (de ese capítulo 
deberías recordar también los conceptos de arco y nodo, que aquí resultan básicos) 

Este es el tipo de modelo que implementan, por ejemplo, los navegadores GPS, 
ya que el movimiento que estudian y sobre el cual nos informan se realiza siempre 
por una red de carreteras y calles. Sin embargo, si lo que pretendemos es calcular un 
coste de desplazamiento no confinado a una vía (por ejemplo, para calcular la ruta de 
menor coste caminando campo a través), es el modelo ráster el que debemos utilizar. 

Aunque formalmente son distintos tanto los modelos de representación como 
los casos particulares de análisis, la implementación de los algoritmos de cálculo 
de rutas de mínimo coste es en cierta medida similar. Así, los algoritmos sobre 
una base vectorial comparten elementos con los que ya conocemos para el análisis 
ráster. Estos algoritmos en realidad derivan todos ellos de la denominada teoría 
de grafos , una rama de la matemática que se encarga de trabajar con un tipo de 
estructuras denominadas grafos, de los cuales una red es una caso particular 2 . 

El cálculo de rutas óptimas es una de las áreas más trabajadas dentro de la 
teoría de grafos, y por ello existen muchos algoritmos distintos. El más popular 
de todos ellos es el propuesto por Edsger Dijkstra, que es en cierto modo en el 
que se basan las metodologías que hemos visto para el caso ráster. En realidad, 
las celdas de una capa ráster pueden entenderse también como una estructura de 
nodos conectados (una red), con la particularidad de que estas conexiones tienen 
una carácter sistemático: cada celda (nodo) está conectado siempre a las ocho que 
se sitúan entorno a ella, y únicamente a estas. 

2 Para el lector que desee conocer la parte estrictamente matemática de esta disciplina, pueden 
encontrarse interesantes libros sobre teoría de grafos en las direcciones Web [330] y [331] . 
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En el algoritmo de Dijkstra, se inicia el cálculo en el nodo de destino y se 
marcan los nodos a los que este se encuentra conectado, asociándoles el valor de 
coste entre dicho nodo inicial y cada uno de estos otros nodos. Los restantes nodos, 
hasta que no sean marcados con un valor concreto de coste, tienen un coste infinito, 
pues aún no se ha establecido una manera de conectarlos con el nodo de destino. 

Al acabar este proceso, se procede a repetirlo, en esta ocasión con todos los 
puntos que han sido marcados en la iteración anterior. En esta nueva iteración, 
cada uno de los nodos conectados recibe como nuevo valor de coste el del nodo 
base (que será uno de los conectados al nodo original) más el coste de desplazarse 
entre este nodo y el nodo conectado a él. En caso de ya tener un valor de coste 
asociado, solamente se le asociara este nuevo si es inferior al valor existente (es 
decir, solo si la ruta que estamos evaluando en este paso es de menor coste que la 
que anteriormente se evaluó al asignar dicho valor de coste previo) . Este proceso 
de recalculo de coste asociado a un nodo se conoce como relajación. 

La figura 19.12 muestra un ejemplo de un grafo muy sencillo y el proceso de 
ejecución del algoritmo de Dijkstra sobre este. 





Figura 19.12: Ejemplo de aplicación del algoritmo de Dijkstra para cálculo de rutas 
de mínimo coste. De izquierda a derecha, etapas sucesivas de asignación de coste por 
nodos (Adaptado de Wikipedia). 

La descripción original del algoritmo puede consultarse en [332] . Para el lector 
interesado en profundizar sobre esta materia, un buen compendio de algoritmos 
de cálculo de rutas óptimas puede encontrarse en [333] . 

Existen numerosos cálculos relacionados con las redes y la teoría de grafos 
cuya importancia dentro del ámbito SIG es notable. Uno de los más conocidos es 
el problema del árbol mínimo de recubrimiento, más habitualmente denotado por 
su nombre en inglés: mínimum spanning tree (MST). Dado un conjunto de puntos, 
este árbol representa el mínimo conjunto de líneas que permite conectar todos esos 
puntos. Es decir, el problema del MST implica crear una red que aporte conectividad 
a un conjunto dado de puntos, teniendo esa red la mínima longitud posible. 

Este problema clásico en la teoría de grafos (y por tanto también muy estudiado 
al igual que los relativos al cálculo de rutas mínimas que acabamos de ver) tiene 
numerosas aplicaciones cuando se traslada al campo del análisis geográfico. Por 
ejemplo, permite calcular la red de canalizaciones necesaria para abastecer a una 
serie de puntos, minimizando el gasto en tuberías. 

La figura 19.13 presenta un ejemplo de uno de estos árboles. 
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El problema puede resolverse considerando distancia euclídea, o bien teniendo 
en cuenta que los puntos se encuentran conectados por una red, con un coste dado 
entre cada par de ellos. En este segundo caso, la obtención del MST implica la 
reducción de la red original que los conecta, eliminando tramos hasta lograr el 
conjunto mínimo de ellos que mantiene la conectividad. 

De entre los múltiples algoritmos existentes para resolver este problema, los 
de Prim[334] y Kruskal[335] son los más habituales. Los propuestos originalmente 
por el matemático checo Otakar Boruvka constituyen la base para gran parte de 
las formulaciones más elaboradas. Pueden encontrarse en [336] 

Puesto que se obtiene como resultado un árbol y este es un grafo de tipo 
acíclico, la ausencia de ciclos (circuitos cerrados) garantiza que no existan tramos 
«redundantes» en la red. Por esta razón, la estructura de árbol es la adecuada 
para minimizar la longitud de la red. Desde la perspectiva de su aplicación real, 
no obstante, un árbol no es la forma más ventajosa de conectar una serie de 
puntos, ya que la conectividad es reducida y puede perderse si se pierde una de 
las conexiones (en otras palabras, si se rompe una tubería, habría puntos que no 
estarían abastecidos, y no resultaría posible abastecerles por otra vía). 



Figura 19.13: Árbol mínimo de recubrimiento para un conjunto de puntos. 

Una solución más adecuada es optar por una estructura que trate de reducir la 
longitud total de la red, pero garantizando una conectividad más robusta. El MST 
guarda mucha relación con una estructura que ya conocemos, la triangulación de De- 
launay, ya que se forma como un subconjunto de las líneas que conforman esta (pue- 
de consultarse por ejemplo[337] para ver detalles acerca del algoritmo de cálculo del 
MST a partir de la triangulación). Si de ese conjunto total de la triangulación se to- 
man las líneas del MST y algunas adicionales, pueden obtenerse estructuras que so- 
lucionan de manera óptima el problema de conectar un conj unto de puntos con un di- 
seño de red robusto. Un ejemplo de ésto son las denominadas redes de Gabriel [338] . 

También en cierta forma relacionado con los problemas anteriores, un enun- 
ciado clásico con gran aplicación en el ámbito SIG es el conocido como problema 
del viajante o TSP 3 . Dado un conjunto de puntos, se trata de calcular la forma 

3 Travelling Salesman Problem 
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de visitar todos ellos en un orden dado y regresando al punto inicial, de tal modo 
que el recorrido total tenga la mínima longitud posible. 

Este problema es uno de los problemas más conocidos dentro del campo de 
la optimización combinatoria, y se se encuadra dentro de los conocidos como 
NP-Hard. La forma más directa y simple de resolver este problema es probar 
todas las posibles rutas y elegir la más corta. Sin embargo, debido al crecimiento 
exponencial del número de posibilidades, este planteamiento es inviable, y se ha 
de optar por métodos de resolución aproximada. Dado el grado de estudio este 
problema, estas soluciones son muy variadas, y existe bibliografía muy abundante 
al respecto. Pueden consultarse más sobre formas de resolución del TSP en [339]. 

En relación con los SIG y, particularmente, con el tema de este apartado, el pro- 
blema del viajante cobra interés cuando se considera, al igual que ya veíamos para 
el MST, que las distancias entre los distintos puntos no han de ser necesariamente 
euclídeas, sino que pueden ser distancias a través de una red. Así, si una persona ha 
de visitar un número dado de emplazamientos dentro de una ciudad desplazándose 
en un automóvil, el orden óptimo en que debe hacerlo es el que se obtendría 
como solución al problema del viajante para dichas localizaciones, y tomando las 
distancias entre estas como distancias por las calles de la propia ciudad. 

Independientemente de la métrica empleada para calcular la distancia entre 
puntos, la solución del problema se puede realizar empleando la misma metodología. 

En la figura 19.14 puede verse el circuito óptimo para el conjunto de puntos 
empleado en el ejemplo anterior de la figura 19.13. 



Figura 19.14: Solución al problema del viajante para un conjunto de puntos. 

Para concluir este apartado, comentar que el concepto de buffer vectorial puede 
extenderse si disponemos de una red sobre la que calcular distancias, haciéndolos 
más similares a los que hemos visto para el caso ráster, donde la anchura de estos 
era variable y no se presentaba la característica simetría de los que vimos en el 
capítulo 18. Sobre dicha red, podemos calcular puntos a una distancia dada, y con 
ellos crear el polígono que delimita la zona de influencia. 

La figura 19.15 muestra una red viaria con costes asociados, y una posible zona 
de influencia basada en dichos costes en lugar de en distancia euclídea. 



Figura 19.15: Zona de influencia de un punto considerando distancias sobre una red 
en lugar de distancia euclídea. 

19.8. Resumen 

Las superficies de fricción contienen valores de coste que expresan la resistencia 
que presenta una celda a ser recorrida. Estos costes pueden reflejar muchos distintos 
factores, siendo la distancia uno de ellos. 

Con una superficie de fricción y un conjunto de puntos de destino, se calculan 
capas de coste acumulado. Empleando estas es posible calcular rutas óptimas que 
nos definen la ruta de menor coste desde un punto dado hasta el punto de destino 
más cercano (en términos de coste) . 

Empleando las ideas del análisis de coste se definen zonas de influencia tanto 
de dimensión fija como de dimensión variable, y puede estudiarse asimismo la 
influencia conjunta de una serie de elementos geográficos sobre el entorno inmediato 
de estos. 

Aunque el análisis de costes y superficies de fricción es un análisis con elementos 
ráster, las redes vectoriales con topología permiten un análisis distinto para calcular 
rutas óptimas entre puntos dados de dichas redes. 
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Capítulo 20 


Más estadística espacial 


En el capítulo 12 vimos algunos elementos estadísticos aplicados al ámbito de los 
datos espaciales. Dentro de este continuaremos extendiendo ese conjunto de formulaciones 
estadísticas y viendo cómo otras pueden adaptarse de un modo similar. 

Las formulaciones de este capítulo se aplican mayoritariamente sobre capas de datos 
ráster, y el álgebra de mapas es la herramienta principal que debe conocerse para entender 
dichas formulaciones. Algunas metodologías nos permitirán generar capas ráster a partir 
de datos vectoriales, lo que hace interesante haber leído anteriormente el capítulo 13. Las 
imágenes son un tipo de dato muy utilizado en algunas de estas formulaciones, por lo que 
la lectura del capítulo dedicado a estas también es recomendable. 


20.1. Introducción 

Prácticamente todas las formulaciones estadísticas pueden aplicarse a datos 
geográficos de igual forma que se aplican a datos de otro tipo. No obstante, la 
particular naturaleza de la información geográfica hace que algunas de estas for- 
mulaciones puedan adaptarse de forma específica para obtener resultados más 
correctos. En particular, la inferencia estadística presenta, como ya vimos, una 
serie de peculiaridades que hacen conveniente su adaptación para considerar la 
especial naturaleza debida a la presencia de una componente espacial. 

En este capítulo, intentaremos profundizar algo más sobre el empleo de estas 
herramientas estadísticas dentro del ámbito de un SIG, viendo, entre otros, los 
métodos de regresión que consideran explícitamente la componente espacial de 
los datos, así como las metodologías que constituyen la base para la creación de 
modelos predictivos, de gran aplicación dentro de los SIG. 

Asimismo, existe una operación estadística con un particular peso dentro del 
ámbito del SIG: la clasificación, la cual constituye un elemento básico especialmente 
en el tratamiento de imágenes y la creación de datos espaciales de carácter temático 
a partir de estas. Dedicaremos gran parte del capítulo a detallar los pormenores del 
proceso de clasificación y algunas, las más populares, de sus muy diversas variantes. 

Ya conocemos algunas formulaciones que nos permiten, a partir de una capa rás- 
ter (sea una imagen o no) , obtener capas vectoriales o nuevas capas ráster de variable 
discreta, conteniendo una información adecuada para ser expresada en formato 
vectorial, de forma similar a las operaciones de clasificación. El capítulo dedicado al 
procesado de imágenes contenía algunas de estas formulaciones, basadas en aquel 
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caso en operaciones con apenas componente estadística. Los procesos de clasifica- 
ción de este capítulo abordan, como hemos dicho, una tarea similar, pero desde un 
enfoque principalmente estadístico. Pese a ello, y como veremos, puede emplearse 
también la componente espacial de los datos para obtener dicha clasificación. 

El Análisis de Componentes Principales , otra técnica estadística habitual, 
también es de gran utilidad en el trabajo con imágenes, especialmente cuando 
estas contienen un gran número de bandas. La redundancia que aparece en estas 
imágenes al existir dependencia entre sus bandas puede eliminarse aplicando esta 
técnica, al igual que cuando se trabaja con cualquier otro conjunto de múltiples 
capas, cada una de ellas referida a una variable distinta. 

Por último, cerraremos el capítulo presentando algunas metodologías que nos 
ayudaran a extender las capacidades de las operaciones locales del álgebra de 
mapas, es decir, aquellas que empleábamos para combinar una serie de capas ráster. 
Las operaciones algebraicas que utilizamos para efectuar dicha combinación de 
capas pueden mejorarse si se aplica un análisis estadístico de las distintas variables 
combinadas, dando esto lugar a metodologías más avanzadas, algunas de las cuales 
describiremos aquí. 

Si el campo de la estadística es amplio de por sí, el de la estadística espacial 
no lo es menos. Además de las adaptaciones particulares de los procedimientos 
estadísticos más relevantes al ámbito espacial, existen formulaciones particulares 
con un rango más o menos amplio de aplicación. No es el objetivo de este capítulo 
el tratarlas todas ellas en profundidad, ni tan siquiera citarlas, sino presentar por 
un lado algunos de los fundamentos de las operaciones más habituales y prácticas, 
y por otro mostrar con algo más de extensión que lo ya visto la forma en que la 
estadística clásica se adapta al ámbito en el que trabajamos dentro de un SIG. 


20.2. Clasificación 

La clasificación es una operación muy habitual dentro del análisis SIG, pues per- 
mite establecer una categorización de un área de estudio a partir de una serie de va- 
riables, con la utilidad que ello conlleva para otros análisis. Esencialmente, el proceso 
de clasificación convierte una serie de capas en otra única con información categórica. 
Las capas de origen suelen contener en general variables de tipo continuo, aunque no 
necesariamente. Se trata de, en función de la información disponible sobre un área 
geográfica, clasificar de acuerdo con algún criterio las distintas zonas de la misma. 

Esta clasificación se desarrolla mediante procedimientos diversos que evalúan 
a cuál de las clases posibles es más similar un punto dado. En dicho punto, se 
toman los valores de todas las variables registradas y ese conjunto de valores es 
el utilizado para calcular el grado de similitud entre la clase presente en el punto 
(aún no determinada) y las distintas clases posibles. 
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Dos circunstancias son de reseñar en relación con la naturaleza de las capas 
de partida: 

■ Por tratarse de variables continuas en la mayoría de los casos, se suele 
trabajar principalmente con capas ráster como capas de origen. 

■ Por utilizarse en general más de una variable, se requieren varias capas para 
almacenar estas. 

Como ya vimos, la estructura de las imágenes procedentes de teledetección, 
en formato ráster y con múltiples bandas, las hace ideales para ser utilizadas como 
datos de partida para obtener capas clasificadas. Por esta razón, es frecuente ver los 
algoritmos de clasificación tratados en textos dedicados al análisis de imágenes, o 
bien en las partes sobre imágenes de los textos genéricos sobre SIG. No obstante, no 
deben entenderse como limitados a este tipo de datos, ya que resultan igualmente 
de utilidad aplicados sobre un número dado de capas ráster, sin que estas sean 
bandas de una imagen o sin que las variables empleadas hayan sido recogidas por 
un mismo instrumento o sensor. 

Un número dado de valores recogidos en otras tantas bandas de una imagen 
sirven para evaluar, por ejemplo, el tipo de material del que se compone un suelo, 
puesto que las distintas clases establecidas en función de esos materiales guardan 
relación con las intensidades a distintas longitudes de onda que dicho suelo refleja. 
Pero del mismo modo, y como ya se comentó en 15.8, las formas del relieve también 
pueden dividirse en clases atendiendo a la pendiente, la curvatura o el índice de 
humedad topográfica, entre otros parámetros. Y de manera similar, establecer una 
caracterización de las distintas zonas puede llevarse a cabo a partir de valores de 
pH del suelo, pendiente o humedad, por nombrar algunos. 

Incluso pueden combinarse bandas procedentes de imágenes y otro tipo de 
variables. Por ejemplo, al clasificar las distintas zonas de vegetación a partir de una 
imagen, pueden añadirse valores de pendiente o elevación, ya que estos parámetros 
del terreno tienen una obvia relación con la vegetación existente. 

Como veíamos en el capítulo sobre imágenes, el conjunto de valores de las 
distintas bandas de una imagen en un punto constituía lo que denominábamos 
firma espectral. Al trabajar con otro tipo de variables, el conjunto de valores en 
un punto que empleamos para clasificarlo ya no recibe ese nombre, que es propio 
del análisis de imágenes, pero el concepto sigue siendo, sin embargo, el mismo. 

En el caso de imágenes, la clasificación es, además de una técnica estadística, 
un proceso con una base física, pues pueden estudiarse directamente los valores 
de radiación reflejada a distintas longitudes de onda y adjudicarles un significado 
en función de lo que dichas longitudes de onda condiciones. En otros ejemplo, 
sin embargo, se trata de un proceso meramente estadístico. Esta componente 
estadística y su formulación será lo que veamos en este apartado. 

En todos los supuestos anteriores, con imágenes u otro tipo de datos, y en 
muchos otros casos que pueden plantearse, los métodos para efectuar la clasifica- 
ción son los mismos. Por ello, en lugar de haber tratado estas formulaciones de 
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clasificación en el capítulo dedicado a las imágenes como algo exclusivo de estas, 
las estudiamos en este como parte de un conjunto de metodologías aplicables de 
forma genérica a cualquier tipo de dato. Las imágenes, no obstante, son un tipo 
de dato sobre el que se efectúa con mayor frecuencia este análisis. 

La clasificación, pues, puede definirse como el proceso que, dados un conjunto 
de elementos (en este caso, localizaciones espaciales) las agrupa en una serie de 
clases de forma que estas sean homogéneas en cuanto a las características de los 
elementos que contienen. 

Este proceso conlleva dos etapas: 

■ Definición de las clases 

■ Asignación de cada elemento a una de dichas clases 

En función de cómo se lleve a cabo la definición de las clases, los métodos de 
clasificación pueden dividirse en dos grupos principales: 

■ Clasificación supervisada. Además de emplear las capas como entrada, debe 
añadirse información adicional que ayude en la definición de las distintas 
clases, definiendo el número de estas y sus características. 

■ Clasificación no supervisada. La única entrada son las capas y el número de 
clases a definir. Las características de dichas clases se establecen en función 
del conjunto de valores con los que se trabaja. 

20.2.1. Clasificación supervisada 

La clasificación supervisada es una forma de clasificación que requiere por 
parte del operador la definición explícita de las clases a definir. En la terminología 
empleada para las imágenes, podemos decir que el operador debe introducir la 
firma espectral característica de las clases, expresada esta como los valores más 
habituales que aparecen para dicha clase. El proceso de clasificación asigna a un 
punto aquella clase cuyo conjunto de valores «típicos» de las variables estudiadas 
(los que vienen definidos por esa firma espectral característica) son más similares 
a los presentes en dicho punto. 

La figura 20.1 muestra un esquema de este proceso. 

La forma en que pueden proporcionarse definiciones de clase a un método de 
clasificación supervisada son dos: 

■ Mediante zonas de entrenamiento 

■ Mediante valores directos 

Al utilizar zonas de entrenamiento, el operador debe delimitar algunas zonas 
en las que se conozca a priori el tipo de clase existente. Esto puede hacerse con 
una capa de polígonos adicional que tenga asociado en un campo de su tabla de 
atributos el tipo de clase presente en dicho polígono. El algoritmo de clasificación, 
en su primera fase, estudiará las celdas de las capas de entrada que caen dentro de 
los polígonos de cada clase, y con sus valores tratará de definir los rasgos generales 
de esas clases que permitirán identificar clases similares en otros puntos. 
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Figura 20.1: Esquema del proceso de clasificación supervisada 


A la hora de definir estas zonas de entrenamiento debe procurarse que cubran 
toda la casuística de las clases que definen. Si, por ejemplo, queremos clasificar 
un área de estudio en tres simples clases como «bosque», «cultivo» y «carretera», 
y las zonas de bosque son heterogéneas (distintas especies, distinta densidad, etc.), 
será conveniente definir zonas de entrenamiento en distintos tipos de bosque, para 
que puedan extraerse las características comunes a todas las subtipologías que 
vamos a englobar en una única clase. 

Por supuesto, si queremos definir una clase concreta, debemos establecer una 
o varias zonas de entrenamiento de esta. Es decir, el algoritmo solo clasifica en 
los grupos que el operador haya definido. Si en el área de estudio mencionada 
anteriormente existieran zonas en barbecho (que no pertenecen a ninguna de las 
tres clases señaladas), estas no van a asignarse a una clase nueva. En función de 
la metodología que posteriormente se use para dicha asignación, o bien quedarán 
sin clasificar (si son muy distintas sus características de las de todas las clases 
establecidas) , o bien quedarán englobadas dentro de la clase con la cual presenten 
una mayor similitud (que probablemente, y pese a ser la más similar de las tres 
definidas, no sea muy parecida a la realidad). 

Para obtener mejores resultados, las zonas de entrenamiento deben ser lo más 
representativas posibles, y deben establecerse siempre que se tenga la seguridad 
de que efectivamente pertenecen a la clase a definir. Un mayor número de zonas 
de entrenamiento implica mejor clasificación en líneas generales, pero solo si estas 
zonas constituyen una definición coherente de la clase, y no si se emplean zonas 
cuya tipología no se conozca con plena certeza. 

Cuanto más grandes sean las zonas de entrenamiento, más celdas contendrán 
en las capas de variables analizadas, y más precisa sera la definición de las carac- 
terísticas de cada clase. [340] recomienda que se tomen para cada clase al menos 
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un número de celdas diez veces superior al de variables consideradas, siendo más 
adecuado que este sea cien veces mayor. 

Además de emplear zonas de entrenamiento, la otra forma de comunicarle al 
algoritmo de clasificación qué clases queremos definir y qué características tienen 
estas es mediante valores directos. En el análisis de las zonas de entrenamiento, 
las zonas se caracterizan según unos valores estadísticos tales como la media y la 
desviación típica de las distintas variables empleadas. Si ya hemos realizado ese 
proceso anteriormente, dichos valores ya han sido calculados, y podemos utilizarlos 
para alimentar un nuevo proceso de clasificación en otro área de estudio. Lógica- 
mente, esto es posible solo si las clases a definir tienen similares características en 
este nuevo área y en la utilizada originalmente para la caracterización de clases. 

La utilización de valores provenientes de bases de datos de firmas espectrales, 
las cuales se vieron en el capítulo 16, constituye otro ejemplo del uso de valores 
directos en lugar de zonas de entrenamiento. 

Una vez que las clases se han definido, el proceso de clasificación asocia cada 
punto de la zona de estudio a una de ellas en función de sus valores. Los métodos 
existentes para llevar a cabo esta fase del proceso son muy diversos, y la literatura 
estadística recoge decenas de ellos. Dentro del ámbito de los SIG, los más habituales 
son los siguientes: 

■ Clasificación por paralelepípedos. 

■ Clasificación por mínima distancia 

■ Clasificación por máxima verosimilitud 

Se trata de métodos sencillos en su mayoría, existiendo formulaciones más 
complejas y avanzadas que, no obstante, resulta menos frecuente encontrar imple- 
mentadas en un SIG. Algunos de estos métodos que merecen ser mencionados son 
los basados en redes neuronales, árboles de decisión o sistemas expertos. La ventaja 
frente a los anteriores es que no asumen una distribución estadística particular 
de los datos, y pueden aplicarse aun en el caso de que dicha distribución no se dé. 

Para más información, pueden consultarse, entre otras referencias, [341], [342], 
[343] y [344] . Métodos basados en lógica difusa se recogen, por ejemplo, en [345] . To- 
das estas metodologías se presentan generalmente aplicadas a la clasificación de imá- 
genes, aunque una vez más su uso no se ha de restringir al caso particular de estas. 

Antes de aplicar cualquiera de estos métodos o los que seguidamente veremos 
con detalle, puede resultar recomendable homogeneizar los rangos de las distintas 
variables. En el caso de emplear únicamente imágenes, los Niveles Digitales de 
estas se encuentran siempre en el mismo rango (0-255), pero este puede ser más 
heterogéneo si se usan capas con otro tipo de variables. Un proceso de normali- 
zación (lo vimos en 14.2.1) es una opción habitual en este caso, empleándose como 
preparación previa al análisis y la clasificación. 
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Paralelepípedos 

El método de clasificación por paralelepípedos establece regiones, una por cada 
clase, con dicha forma de paralelepípedos dentro del espacio de atributos en el 
que se trabaja. La pertenencia de una localización a una de las clases se establece 
viendo si la posición que sus valores definen en el espacio de atributos está dentro 
de la región correspondiente a la clase. 

Los distintos lados de los paralelepípedos vienen definidos por la media de cada 
variable en la clase y su desviación típica. La longitud de los lados es igual a dos 
veces la desviación típica, y se encuentran centrados en la media. Un esquema de 
esto puede verse en la figura 20.2. Los puntos representados son elementos que se 
quieren clasificar, que en el caso de una capa ráster serán mucho más numerosos, 
uno por cada celda. Por simplicidad de representación y visualización, se supone 
en dicha figura, así como en las siguientes correspondientes a otros métodos, que 
se utilizan dos variables para efectuar la clasificación (por tanto, es un gráfico 
bidimensional) , y se definen tres únicas clases. El mismo tipo de análisis puede, 
no obstante, aplicarse a cualquier numero n de variables (resultaría un espacio 
de atributos n-dimensional) y, por supuesto, cualquier número de clases. 


Variable 2 




► Variable 1 

Figura 20.2: Método de clasificación por paralelepípedos 

Una característica de este método es que pueden existir elementos que no pue- 
dan ser clasificados al no caer dentro de ningún paralelepípedo. Del mismo modo, 
estos pueden solaparse y ciertos elementos pueden pertenecer simultáneamente 
a varias clases. En caso de darse esta circunstancia, puede ser resuelta aplicando 
alguno de los otros métodos tal como el de máxima verosimilitud. 

En general, la precisión de este método es baja, y el número de elementos sin 





540 


Sistemas de Información Geográfica 


clasificar o clasificados en varias categorías es alto. Su mayor ventaja reside no en 
su exactitud, sino en la velocidad de proceso, al no requerir operaciones complejas, 

Mínima distancia 

El método de mínima distancia se basa también en conceptos geométricos 
dentro del espacio de atributos. En este caso se emplea únicamente la media de 
cada clase, prescindiéndose de la desviación típica. 

Para cada uno de los elementos a clasificar se calcula la distancia euclídea en el 
espacio de atributos entre la media de cada clase y dicho elemento. Esta distancia 
viene expresada por 


siendo dk la distancia del elemento al centro de la clase k-ésima, x % el valor asociado 
al elemento para la variable i-ésima, y la media de los valores de la clase k-ésima 
para la variable i-ésima. 

Aquella clase hasta la que exista una menor distancia será a la que se asigne 
el elemento en cuestión. 

En lugar de emplear distancia euclídea puede utilizarse la distancia de Man- 
hattan, ya que disminuye el número de operaciones (lo cual implica más velocidad 
de proceso) . 

Puede verse que esta metodología guarda similitud conceptual con la interpo- 
lación por vecindad, en la que asignábamos el valor del punto más cercano. En 
la figura 20.3 puede verse un gráfico explicativo de este método de clasificación. 



(20.2.1) 


Variable 2 



Variable 1 


Figura 20.3: Método de clasificación por mínima distancia 
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A diferencia del método anterior, todos los elementos pueden ser clasificados, 
ya que siempre existe uno más cercano. Esto constituye una de las potenciales 
desventajas del método, ya que puede hacer asignaciones incorrectas en el caso 
de que un elemento sea muy distinto a todas las clases de partida. Se asignará a 
la clase más similar, lo cual no significa necesariamente que sea lo suficientemente 
similar a ella como para considerarlo parte de la misma. 

Por ejemplo, y repitiendo un ejemplo ya citado, si tenemos las clases «bosque», 
«cultivo» y «carretera», y en nuestro área de estudio existe una zona en barbecho, 
esta será clasificada dentro de alguno de los grupos anteriores, que puede ser uno u 
otro en función de los datos que empleemos para la clasificación. Con independencia 
de cuál sea esa clase escogida, resulta claro que sera una asignación errónea, y que 
o bien debería haberse incorporado esta clase dentro de las zonas de entrenamiento, 
o bien toda esa zona de barbecho debería quedar sin clasificar. 

Un método similar al de mínima distancia es el basado en distancia de Maha- 
lanobis. 

La distancia euclídea puede expresarse de forma matricial como 


d k =\/{X-X k ) T (X-X k ) (20.2.2) 

donde X y X k son respectivamente los vectores de valores del elemento a clasificar 
y de valores medios de la clase k-ésima. 

La distancia de Mahalanobis es una generalización de esta, y en su forma 
matricial tiene la siguiente expresión: 


4 = s]{X-X k ) T C- l {X-X k ) (20.2.3) 

donde C es la matriz de covarianzas entre las variables estudiadas. Es decir, una 
matriz de la forma 


( 
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(20. 2 A) 


Máxima verosimilitud 

A diferencia de los anteriores, el método de máxima verosimilitud no evalúa un 
parámetro geométrico dentro del espacio de atributos, sino que se basa en funda- 
mentos estadísticos. Conociendo la media y desviación típica que caracteriza a una 
clase, podemos suponer una función de densidad de probabilidad, y con los valores 
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de un elemento dado estimar la probabilidad de que estos correspondan a cada 
clase. La clase con una mayor probabilidad es aquella a la que se asigna el elemento. 

Este método comparte con el de distancia mínima el hecho de que todos los 
elementos quedan clasificados. No obstante, resulta sencillo aplicar un umbral 
inferior a los valores de probabilidad, de tal forma que si la clase más probable 
tiene un valor por debajo del umbral no se asigne el elemento a dicha clase. En 
este caso el método es en cierta medida semejante al de paralelepípedos, pero en 
lugar de estos se tienen hiperelipses n-dimensionales. Puede darse igualmente el 
caso de que un elemento se encuentre dentro de varias de estas hiperelipses, el cual 
se resuelve, no obstante, directamente con los valores de probabilidad de estas. 

Puede verse un gráfico relativo a este método en la figura 20.4, considerando 
la aplicación de un umbral inferior de probabilidad. 

Variable 2 



Figura 20.4: Método de clasificación por máxima verosimilitud. 

Es importante recalcar que al emplear este método se asume que los datos 
tienen una distribución normal, lo cual no ha de ser necesariamente cierto según 
qué tipo de variables manejemos. Es importante tener en cuenta este hecho antes 
de utilizar este clasificador sobre nuestros datos. 

20.2.2. Clasificación no supervisada 

Los métodos de clasificación no supervisada no requieren del operador la defini- 
ción explícita de las clases. No es necesario ningún conocimiento a priori, ya que es 
el propio algoritmo quien las define de acuerdo a los datos. Para llevar esto a cabo 
es necesario suministrar algunos valores tales como el número de clases que se desea 
crear, los tamaños mínimos y máximos de cada una, o ciertas tolerancias para la 
distinción entre clases. Estos parámetros «guían» al algoritmo en la definición de 
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clases, que se produce en estos métodos de forma simultanea a la asignación de 
los elementos a una u otra de dichas clases. 

En general, se trata de procedimientos iterativos en los que una clasificación 
inicial va convergiendo hacia una final en la cual se cumplen las características 
buscadas de homogeneidad, número de clases, etc. 

Por su propia naturaleza, estos métodos no generan clases de las cuales se conoce 
su significado, y será necesario estudiarlas después para saber qué representa cada 
una de ellas. Si en un método de clasificación supervisada definimos zonas de entre- 
namiento con distintas clases de suelo, el resultado sera una capa con clases de suelo. 
Si diferenciamos según otro criterio, será ese criterio el que quede reflejado en la ca- 
pa resultante. En el caso de la clasificación no supervisada, no existe tal criterio, ya 
que simplemente se aplican meras operaciones estadísticas con los datos, pero no se 
trabaja con el significado de estos. Al utilizar una zona de entrenamiento sí estamos 
empleando este significado, ya que le estamos diciendo al algoritmo que los valores 
de dicha zona representan una clase dada, esto es, que «significan» dicha clase. 

Junto a la capa de clases resultantes, los métodos de clasificación no supervisada 
proporcionan una definición de dichas clases a través de los valores estadísticos de 
las mismas. Estos valores se emplearán para asignar una interpretación a cada clase 
una vez estas hayan sido definidas. Junto a ellas, es habitual añadir la varianza 
de cada clase, como indicador de la homogeneidad lograda en la clasificación. 

Aunque los métodos de clasificación no supervisada son validos de por sí para 
establecer una separación categórica dentro de un área de estudio, es habitual que 
se empleen como soporte a métodos de clasificación supervisada. Mediante estos 
métodos se obtiene una primera división, que puede utilizarse posteriormente bien 
sea para la definición de zonas de entrenamiento o bien para operaciones más 
complejas como la clasificación basada en objetos que veremos más adelante. 

Al igual que sucedía en el caso supervisado, existen numerosos métodos de 
clasificación no supervisada. La literatura estadística es rica en este tipo de formu- 
laciones, conocidos como métodos de clustering 1 , siendo dos de los más habituales 
dentro del ámbito de los Sistemas de Información geográfica los siguientes: 

■ Distancia mínima iterativa 
. ISODATA 

Distancia mínima iterativa 

El método de distancia mínima iterativa [346] se basa en un proceso iterativo 
en el cual, a partir de unas clases iniciales definidas arbitrariamente, se asignan 
los distintos elementos a estas mediante un método de los vistos en el apartado 
anterior, particularmente el de distancia mínima. El número de clases iniciales es 
definido por el operador, y será el que aparezca en la capa resultante. Para aplicar 

1 De cluster (agregado), nombre que recibe cada una de las clases o agrupaciones en las que 
se dividen los elementos de partida 
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la clasificación por distancia mínima solo es necesario conocer los valores medios de 
las clases, siendo este el único estadístico de cada clase con el que se va a trabajar. 

Una vez que se ha realizado la asignación de clases en la primera iteración, se 
estudian los puntos que están incluidos en cada clase y se calculan nuevamente los 
valores de las medias por clase. Es decir, las clases resultantes del proceso anterior 
son utilizadas en cierto modo como zonas de entrenamiento. Con estos nuevos valo- 
res calculados de las medias, se vuelve a repetir la fase de asignación por distancia 
mínima, y así sucesivamente hasta que se cumple un criterio de convergencia. 

En cada iteración del proceso hay elementos (celdas en nuestro caso, puesto que 
trabajamos con capas ráster) que cambian de clase. El número de dichos elementos 
que varían su clase es empleado como criterio de convergencia, estableciendo un um- 
bral inferior. Si en una iteración el número de elementos que varían es menor que el 
umbral, se considera que el proceso ha convergido y se detiene. La varianza media de 
las clases puede utilizarse también como medida de la modificación que se produce 
entre el resultado de una iteración y el de la anterior. Si no se produce una disminu- 
ción suficiente de la varianza, las iteraciones ya no mejoran la clasificación obtenida, 
con lo cual puede asumirse que el proceso ha convergido a un resultado óptimo. 

El operador especifica dicho umbral de convergencia junto al número de clases 
deseadas, y habitualmente también un número máximo de iteraciones, con objeto 
de detener el proceso en caso de que no se alcance la convergencia especificada. 

Este algoritmo, así como el que veremos seguidamente, clasifican todos los 
elementos en algún grupo, no existiendo la posibilidad de tener una capa resultante 
en la que existan celdas sin clasificar. De hecho, todas las celdas son utilizadas 
para la definición de las medias de clases sucesivas, por lo que puede decirse que 
todas influyen sobre la clasificación de las restantes y al final del proceso estarán 
asignadas siempre a alguna clase. 

Como es fácil intuir, los valores iniciales de las medias de clase condicionan 
el proceso de clasificación, influyendo sobre la rapidez con que este converge y 
también sobre el resultado. Una solución habitual para establecer estos centros de 
clase es hacerlo equiespaciadamente en el rango que los valores a clasificar cubren 
dentro del espacio de atributos. 

En la figura 20.5 puede verse gráficamente la forma de definir estas clases 
iniciales. Sobre la diagonal que atraviesa el espacio de atributos se establecen 
tantos puntos como clases quieran definirse. Estos serán los valores medios a los 
que se calculen las distancias desde cada elemento en la primera iteración. 

Como puede verse, los centros de las clases no se corresponden con los centros 
de los grupos que existen en el conjunto de elementos, pero al cubrir el espacio 
y repartirse a lo largo de este, garantizan que en las sucesivas iteraciones estos 
centros puedan desplazarse al lugar correcto donde las clases que definan presenten 
una mínima variabilidad. 

En la figura 20.6 pueden verse algunas etapas de un proceso de clasificación 
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Variable 2 



- ► Variable 1 

Figura 20.5: Definición de clases iniciales para el proceso de clasificación no supervisada, 
estableciendo los centros de clases equiespaciados en el espacio de atributos. 


no supervisada por el método de distancia mínima iterativa, en el que se aprecian 
los cambios que las clases van sufriendo a lo largo de las sucesivas iteraciones. 



Figura 20.6: Distintas etapas de un proceso de clasificación no supervisada por distancia 
mínima iterativa. 
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ISODATA 

El método ISODATA (Iterative Self-Organizing Data Analysis Technique) 
comparte los mismos fundamentos que el anterior, pero le añade algunos elementos 
adicionales que permiten al operador tener algo más de control sobre el proceso, 
al tiempo que aportan una mayor flexibilidad a los resultados. 

Por una parte, puede darse el caso en que algunas de las clases establecidas 
no tengan suficientes elementos asignados a ellas, y no sea relevante mantenerlas. 
Los elementos de estas clases pueden asignarse a la siguiente clase más cercana. 
El método ISODATA analiza la capa resultante en busca de clases con pocos 
elementos, y en caso de que no superen un umbral mínimo de número de estos, 
los reparte entre las restantes clases. Mediante esta operación, el número de clases 
totales disminuye en uno. 

Otro caso similar se da cuando dos de las clases resultantes son muy simila- 
res, existiendo poca distancia entre sus medias respectivas. En este caso, resulta 
conveniente unir dichas clases. La definición de un umbral mínimo de distancia 
entre clases permite al algoritmo considerar esta circunstancia. 

Un caso opuesto a los anteriores se da cuando una clase tiene una amplitud 
excesiva, de tal modo que la variabilidad en ella sea elevada. Puede establecerse 
un umbral de amplitud en función de la desviación típica, que permita localizar 
dichas clases, para posteriormente dividir estas en dos nuevas. 

Con todo lo anterior, además de especificarse un número de clases a crear se 
establece un número máximo y otro mínimo de clases, para de este modo acotar 
el número de clases totales que resulta de los procesos de ajuste mencionados. 
Incluyendo estos procesos junto a la estructura del algoritmo de distancia mínima 
iterativa, se tiene el proceso global del método ISODATA. 

Como conclusión de esta sección dedicada a la clasificación y los métodos 
existentes, en la figura 20.7 se muestra un ejemplo de clasificación de usos de suelo 
en un área de estudio, en base a imágenes de satélite y parámetros fisiográficos, 
llevada a cabo por algunos de los métodos descritos anteriormente. 





Figura 20.7: Comparación de la clasificación en clases de uso de suelo generada partir 
de una imagen de satélite y parámetros fisiográficos mediante los métodos de a) mínima 
distancia b) máxima verosimilitud y c) mínima distancia iterativa (no supervisada) 
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Clustering jerárquico 


Un algoritmo habitual en clasificación de objetos es la utilización de árboles 
jerárquicos. El proceso se basa en la creación de un árbol en el cual se disponen en 
sus extremos todos los objetos a clasificar, y las ramas que estos conforman se van 
unificando, agrupándose por similitud hasta llegar a formar una única (Figura 20.8) 


Distancia 



Clases 


Figura 20.8: Dendrograma resultante de un proceso de clustering jerárquico 


El dendrograma resultante de este proceso puede utilizarse después para clasifi- 
car los elementos, simplemente descendiendo en él hasta el nivel en el que el número 
de clases existentes sea lo más cercano posible al deseado. Este dendrograma es 
más rico en información que la mera clasificación, ya que presenta distintos niveles 
de agrupación en lugar de uno único. 

El problema con este tipo de métodos para su uso en un SIG es que los ele- 
mentos individuales que clasificamos — las celdas de las capas — , se presentan en 
números muy elevados, del orden de millones. Manejar una estructura de este 
tipo correspondiente a tal cantidad de elementos es impracticable, por lo que 
directamente no puede utilizarse. Es posible aplicarla, sin embargo, sobre una 
clasificación ya previa que reduzca el número de elementos. 

Así, dadas una serie de clases, estas a su vez pueden estudiarse mediante un 
proceso de clustering jerárquico para disponer de información acerca de cuáles de 
ellas son similares y pueden unirse para simplificar la clasificación. La combinación 
de ambos tipos de metodologías es una práctica que permite sacar más partido 
a los datos de partida, analizándolos en varias etapas. 
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20.2.3. Incorporación del criterio espacial 

Hasta este punto hemos clasificado cada elemento en función únicamente de 
su propios valores. Al igual que sucede en todos los casos del análisis espacial, y 
como ya se dijo en los primeros capítulos de esta parte, los distintos valores con los 
que trabajan tienen una referencia geográfica y existe además interacción con los 
valores circundantes. Cada celda de las capas ráster que clasificamos se encuentra 
rodeada de otras celdas y la información de estas celdas pueden ser valiosa para 
su clasificación debido a dicha interacción. 

La información que puede utilizarse puede ser tanto la correspondiente a 
los datos de partida (es decir, las valores de las variables estudiadas en dichas 
celdas circundantes) como la resultante de la propia clasificación, ya que las clases 
resultantes también se presentan en un contexto espacial. 

Si suponemos el sencillo caso comentado anteriormente de clasificar un área de 
estudio en las categorías «bosque», «cultivo» y «carretera», una celda de carretera 
rodeada por completo de celdas de bosque no parece lógico. Este hecho puede 
utilizarse como ayuda a la clasificación. Con un razonamiento similar, aquellos 
métodos con los que es posible que existan elementos sin clasificar pueden tomar 
esta información contextual como apoyo. Una celda sin clasificar rodeada por 
celdas de bosque, lo más probable es que también ella pertenezca a esta tipología, 
a pesar de que a partir de sus valores el método de clasificación no haya sido capaz 
de establecer dicho resultado. 

La incorporación de esta relación entre celdas vecinas puede llevarse a cabo 
a través de la utilización de filtros sobre la capa resultante. Un filtro de mayoría 
es una opción adecuada para homogeneizar la capa resultante y eliminar celdas 
aisladas cuya clase asignada no esté en consonancia con las de su alrededor. 

La relación espacial entre las celdas que se clasifican puede incorporarse también 
antes de efectuar la clasificación, utilizando no solo la información puntual de 
las celdas sino también la información textural. Por «textura» entendemos la 
caracterización de las celdas en función de su entorno, lo cual, como puede intuirse, 
implica la utilización de funciones focales del álgebra de mapas. De modo similar al 
filtro de mayoría antes mencionado (también una función de tipo focal) , la aplicación 
de toda la serie de filtros que vimos en el capítulo dedicado al procesado de imágenes 
da lugar a nuevas imágenes que pueden incorporarse al proceso de clasificación. 

Para el caso de capas genéricas, no necesariamente imágenes, pueden emplearse 
de igual modo las distintas funciones focales tales como la media, el rango, o el 
valor máximo de la ventana de análisis, a seleccionar en función del significado 
de la variable sobre la que se aplican. 

Otra forma de incorporar la relación espacial entre las celdas es la utilizada en los 
denominados métodos basados en objetos. Según estos métodos, no se clasifican las 
capas clasificando cada una de sus celdas, sino bloques de estas con características 
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comunes. Estos bloques son los objetos, que en la fase inicial del método se estruc- 
turan de forma jerárquica a partir de esa estructura y se clasifican posteriormente. 

La creación de dichos objetos a partir de las capas implica un proceso de 
segmentación de estas, y es ahí donde se incorpora el criterio espacial, ya que 
se utilizan, además de estadísticos básicos, la forma, el tamaño o los distintos 
descriptores de la textura de las imágenes. 

Más información sobre métodos de clasificación basados en objetos dentro 
de un ámbito SIG puede encontrarse por ejemplo en [347] o en [348], este último 
con un tratamiento en detalle de los métodos de clasificación, así como de los de 
segmentación necesarios para su empleo. 

20.2.4. Clasificación débil ( soft classification ) 

En contraste con los métodos de clasificación anteriores, en particular los 
de clasificación supervisada, que pueden englobarse dentro de los denominados 
métodos de clasificación fuerte, encontramos otra filosofía distinta en los conocidos 
como métodos de clasificación débil. En estos, el método de clasificación no ofrece 
como resultado una nueva capa cuyas celdas contienen la clase a la que pertenecen, 
sino que la elección de dicha clase recae sobre el operador en base a los resultados 
que el método de clasificación produce. 

Estos resultados son de forma general una serie de capas — tantas como clases 
a las que asignar las distintas celdas existan — , en los cuales el valor de cada celda 
indica la probabilidad de que dicha celda pertenezca a la clase en cuestión. De este 
modo, los clasificadores de tipo suave representan una etapa intermedia dentro 
del proceso de clasificación, ya que recogen los valores que se calculan a lo largo 
de este, pero no dan un veredicto posterior en base a ellos. 

Si se toma el conjunto de las capas y se aplica un operador local de tipo «capa 
de máximo valor», el resultado que se obtendrá será una única capa, que coincidirá 
con la que se obtiene directamente al aplicar el método de clasificación supervisada 
de la forma habitual (es decir, como clasificación fuerte). 

¿Cuál es la ventaja que se obtiene entonces al aplicar un método de clasificación 
débil y obtener las capas intermedias? En general, la información que estas capas 
intermedias contienen es más detallada, y además de poder emplearse para la 
obtención directa de la capa clasificada — el producto más habitual — , pueden 
utilizarse para dar una interpretación adicional a la pertenencia de cada celda a 
una u otra de las clases definidas. 

Por ejemplo, resulta de interés conocer no solo cuál es la clase con mayor proba- 
bilidad sino también aquella que se sitúa inmediatamente después. Si clasificamos 
un píxel como «bosque caducifolio» y la segunda clase más probable es «bosque 
de coniferas», esa asignación de clase no tiene el mismo significado que si dicha 
segunda clase más probable es «barbecho». 

De igual modo, la diferencia entre la probabilidad de la primera y la segunda 
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clase nos dan una idea de la fiabilidad con que podemos afirmar que una celda dada 
pertenece a la clase a la que es asignada. En relación con este hecho se define el 
concepto de incertidumbre de clasificación , el cual para una celda dada se expresa 
mediante la siguiente fórmula: 


Q 

max — — , 

IC = 1 T*- (20.2.5) 

^ n 

donde max es la probabilidad máxima de entre todas las correspondientes a las 
distintas clases, S la suma de todas las probabilidades para la celda en cuestión, 
y n el numero de clases posibles. 

Otra de las posibilidades que los métodos de clasificación suave aportan es la 
clasificación a nivel de detalle mayor que el propio píxel. El hecho de disponer de 
varios valores para cada píxel hace que se pueda inferir información acerca de la 
variabilidad que se da en el mismo, y pueden así definirse pixels mixtos, es decir 
que no pertenecen puramente a una clase, sino a varias. 

Por ejemplo, si en un píxel dado tiene una probabilidad de 0,69 de pertene- 
cer a la clase «bosque de coniferas» y un 0,31 de pertenecer a la clase «bosque 

caducifolio», puede entenderse que la masa boscosa del píxel esta formada por 
ambos tipos de especies, caducifolias y coniferas, en las proporciones que indican 
sus probabilidades asociadas. 

Esta interpretación viene condicionada, no obstante, al cumplimiento de ciertas 
condiciones tales como la pureza de las zonas de entrenamiento (que no existan 
píxeles mixtos en los píxeles empleados para extraer las características de cada 
clase), circunstancia que en muchos casos es difícil de encontrar. No obstante, 
los valores de probabilidad de las clases, correctamente interpretados, ofrecen de 
cualquier forma mayor detalle que un simple valor de clase. 

20.2.5. Validación 

Del mismo modo que en el capítulo 13 veíamos la manera de verificar la bondad 
de un método de interpolación a través del uso de puntos muéstrales de comproba- 
ción, a la hora de clasificar un conjunto de capas en clases podemos contrastar el 
resultado obtenido si disponemos de zonas conocidas de antemano. Estas zonas se 
definen del mismo modo que las zonas de entrenamiento, pero no se utilizan para 
la clasificación, del mismo modo que no empleábamos los puntos de comprobación 
en el proceso de interpolación. Comparando los valores de clase de estas zonas de 
comprobación y los obtenidos mediante la clasificación podemos obtener índices 
de concordancia que permitan juzgar la corrección de dicha clasificación. 

Los métodos que se emplean para esta tarea no son exclusivos de la clasifi- 
cación de imágenes, sino que se adaptan de forma genérica a cualquier proceso 
que requiera la comparación de dos capas con información categórica. Al validar 
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Clase 

A 

B 

C 

D 

A 

20135 

15 

20 

0 

B 

22 

18756 

133 

512 

C 

19 

70 

30452 

345 

D 

3 

457 

272 

7018 


Cuadro 20.1: Matriz de confusión. 


una clasificación, comparamos la capa resultante de dicha clasificación con una 
segunda con valores correctos de clases. 

Otra circunstancia habitual en la que suelen utilizarse estos métodos es para 
comprobar la variación de clases a lo largo de un periodo. Comparando mediante 
estas técnicas la capa correspondiente al inicio del periodo con la del final de este 
puede describirse y cuantificarse el cambio sufrido por las clases. Este planteamiento 
es muy útil, por ejemplo, para analizar el cambio en los usos de suelo de una zona. 

El parámetro más sencillo que describe la similitud entre dos capas categóricas 
es el porcentaje de celdas coincidentes: 


c = 


Nc 

N 


(20.2.6) 


donde c es la concordancia global entre las dos capas, N c el número de celdas que 
presentan el mismo valor en ambas capas y N el número total de celdas existentes. 

Autores como [349] recomiendan al menos valores de 0.85 para considerar que 
la capa clasificada es operativa a efectos prácticos. 

Este parámetro es sumamente sencillo y no refleja la naturaleza de la modi- 
ficación que se produce entre las capas (o en el caso de utilizarse para validar 
una clasificación, la naturaleza del error cometido) por lo que pueden encontrarse 
alternativas más elaboradas. 

Uno de los elementos habituales en estudio de las diferencias entre dos capas 
categóricas es la denominada matriz de confusión o matriz de contingencias , que 
ya mencionamos en el capítulo dedicado a la calidad de los datos espaciales. Se 
trata de una matriz de dimensiones n x n, siendo n el número de clases diferentes 
que existen en el conjunto de las capas. El elemento (i,j) de la matriz representa 
el número de celdas que pertenecen a la clase i en la primera capa y sin embargo 
están dentro de la clase j en la segunda. 

La tabla 20.1 muestra una posible matriz de contingencias para el caso de dos 
capas con un total de 4 clases. 

Con los valores anteriores puede comprobarse entre qué clases se dan los mayores 
cambios (los mayores errores de clasificación) o cuáles son las que presentan una 
clasificación más robusta. Por ejemplo, las clases DyB parecen ser difíciles de 


552 


Sistemas de Información Geográfica 


clasificar, ya que el numero de celdas de la primera asignados a la segunda es elevado, 
y también al contrario. Por el contrario, la clase A parece no presentar problemas, ya 
que tanto su fila como su columna correspondiente presentan ambas valores bajos 
fuera de la celda (1,1), que es la que representa las celdas correctamente clasificados. 

Este último resultado de robustez de clasificación por clases puede calcularse 
con la proporción de celdas correctamente clasificadas respecto a todas las clasi- 
ficadas en dicha clase. La suma total de la fila k-esima dividida entre el valor de 
la celda (k,k) representa la anterior proporción. Es decir, 

r Ek x ' k 

•^kk 

Si esta misma expresión se calcula por columnas, se obtiene la proporción de 
celdas que, aun perteneciendo a dicha clase, han sido adjudicadas a otra distinta. 
Es decir, 


(20.2.7) 


r= l x ki 

•^kk 

Además de estas sencillas proporciones, existen índices más complejos que 
pueden también calcularse a partir de los valores de la matriz de contingencias. El 
más habitual es el denominado índice Kappa de concordancia, cuya expresión es 


(20.2.8) 


I\ = 


P0-Pe 
1 ~Pe 


(20.2.9) 


siendo Pp la proporción total de celdas que coinciden en ambas capas, es decir, 


Pp = 


£?=i xí 




y P e calculado según la expresión 


(20.2.10) 


p o=E 


Y,j=iXijY,j=iXki 

(E"=iELi ^) 2 


(20.2.11) 


Por su expresión, el índice Kappa no presenta sesgo por una posible coincidencia 
casual de clases, ya que tiene en cuenta la posibilidad de que exista concordancia 
por azar. 

A diferencia de la proporción de celdas correctamente clasificadas, cuyo rango 
de valores se sitúa entre 0 y 1, el índice Kappa puede tomar valores desde -1 a 1. El 
valor 1 indica una concordancia completa, mientras que el -1 define una correlación 
de signo negativa. Valores alrededor de 0 indican que no existe correlación entre las 
capas. Valores por encima de 0.75 indican en general una muy buena correlación 
Se deja como ejercicio para el lector el cálculo del índice Kappa y la proporción 
de celdas concordantes a partir de los valores de la matriz de ejemplo. 



MÁS ESTADÍSTICA ESPACIAL 


553 


Al igual que para la proporción de celdas concordantes, el índice Kappa puede 
calcularse no solo para la capa total, sino de forma individual para cada clase. 

Es de reseñar que el uso de la matriz de confusión y parámetros calculados a 
partir de ella como el índice Kappa no es tampoco una herramienta completa a 
la hora de recoger la naturaleza del error que se comete en la clasificación. Por una 
parte, se recoge este error en toda la extensión de la capa, mientras que puede darse 
de forma más notable en determinadas áreas de esta [350] . El error de clasificación 
no es constante a lo largo de toda la zona estudiada. 

Por otra parte, la comprobación puede no ser espacialmente representativa. 
Si comparamos dos capas correspondientes a dos instantes distintos para ver la 
forma en que entre esos instantes han variado las clases presentes en la zona de 
estudio, utilizamos toda las celdas de la capa para la verificación. Sin embargo, al 
comprobar la clasificación de una serie de capas, se compara el resultado tan solo en 
unas zonas determinadas conocidas (si estas zonas conocidas que no empleamos en 
la clasificación cubrieran toda la extensión, no sería necesaria la clasificación). El 
hecho de utilizar zonas que conforman habitualmente bloques y son relativamente 
homogéneas introduce un sesgo que en general hace que la matriz de confusión 
presente una mayor precisión que la que realmente existe [351]. 

Además de las consideraciones espaciales anteriores, también deben considerar- 
se las relaciones en el espacio de atributos. Es decir, las relaciones entre las clases. 
La matriz de confusión no considera estas relaciones, que sin embargo deberían 
tenerse en cuenta para evaluar el verdadero significado de sus valores. 

Supongamos que se clasifica un área de estudio en tres clases de usos de suelo 
como «bosque caducifolio», «bosque de coniferas» y «lago». Si en un emplazamien- 
to encontramos un bosque caducifolio, es un error tanto clasificarlo como bosque 
de coniferas como asignarlo a la clase de lago, pero no cabe duda que esta segunda 
posibilidad supone un mayor error. Al no existir ponderación de las celdas de la 
matriz de confusión a la hora de calcular índices de concordancia, este hecho no 
se tiene en cuenta. 

El hecho de que los bosques de coniferas y caducifolios sean clases similares 
entre sí y los lagos sean una clase bien distinta, hace aparecer un nuevo elemento 
descriptor de las circunstancias que se dan en la clasificación: la separabilidad. El 
concepto es sencillo: resulta más fácil distinguir un bosque de coniferas de un lago, 
que hacerlo de un bosque caducifolio. Esta mayor facilidad o dificultad también 
se traduce a los algoritmos de clasificación como los que hemos visto. 

La separabilidad mide la posibilidad de discriminar de forma efectiva entre cla- 
ses distintas, y puede estudiarse mediante métodos visuales o bien numéricamente. 
El empleo de diagramas [352] o la utilización de parámetros como la distancia 
de Jeffries-Matushita o el índice de Fisher son algunas de las alternativas para 
evaluar la separabilidad. 

Puede encontrarse más al respecto en [353], [276] o [354] 
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20.3. Regresión espacial 

Ya hemos tratado anteriormente algunos conceptos estadísticos, y hemos co- 
mentado cómo la aplicación de estos dentro de un contexto espacial puede no 
ser del todo correcta, al asumirse ciertas condiciones que no se han de cumplir 
necesariamente (véanse los capítulos 12 y 10) 

Uno de los análisis estadísticos con una presencia muy habitual en el ámbito 
SIG es el uso de regresiones, sean estas simples o múltiples. Como vimos en 13.2.3, 
a partir de los valores de una serie de predictores en un punto se puede estimar 
el valor en dicho punto de otra variable dada, conociendo la relación que existe 
entre ellas, de la forma 


z = h 0 +hixi + ...,h n x n +e (20.3.1) 

siendo h\.}i 2 ---h n los predictores y z la variable estimada. El parámetro e representa 
el error, que se supone distribuido normalmente. 

Llevando a cabo este tipo de regresión, se asume que las observaciones son 
independientes entre sí, algo que no es en absoluto cierto en gran parte de los casos 
en los que se emplean datos geográficos. 

El modelo anterior supone igualmente que a lo largo de la zona estudiada no 
existen variaciones de los parámetros estimados, es decir, que estos son constantes 
con independencia de la localización. Esta segunda suposición tampoco ha de ser 
necesariamente correcta, ya que en el contexto espacial en el que se disponen las 
observaciones sobre las que se basa la regresión, pueden existir variaciones locales 
de los parámetros de ajuste. 

De existir esta variación, debe entenderse como parte del error. Adaptar las 
formulaciones habituales para el cálculo de regresiones al ámbito espacial en el que 
trabajamos, requiere superar de uno u otro modo las anteriores circunstancias, y 
buscar la manera en que la variación no forme parte del residuo. De las soluciones 
existentes, una de ellas, construida sobre las anteriores ideas, es la conocida como 
Geographically Weighted -ñe#ressmn 2 (GWR)[355]. En este modelo de regresión, 
la ecuación 20.3.1 se expresa de modo más genérico como 

z(u,v ) = ho(u,v)+hi(u,v)xi + ...,h n (u,v)x n +e(u,v) (20.3.2) 

En este caso, también los parámetros estimados dependen la localización, que 
viene expresada a través de las coordenadas u y v 

La estimación de estos parámetros exige también adaptar el método de Mí- 
nimos Cuadrados Ordinarios, utilizado habitualmente para la estimar los de la 
ecuación 20.3.1. Los parámetros para un modelo de regresión lineal se obtienen 
según la expresión matricial 

2 Regresión Ponderada Geográficamente 
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h = (X T X)~ 1 X T Y (20.3.3) 

Añadiendo una ponderación que dependa a su vez de la localización, tenemos 
la siguiente expresión, que permite calcular los parámetros de la ecuación 20.3.2. 


h=(X T W{u,v)X)~ 1 X T W(u,v)Y (20.3.4) 

siendo W los pesos a utilizar. 

Estos pesos se toman de tal forma que las observaciones situadas más cerca 
del punto donde desean estimarse los parámetros tienen mayor influencia. Este 
tipo de formulaciones de ponderación en función de la distancia ya las hemos visto 
en el capítulo 13, tanto para la interpolación como para el cálculo de densidades. 
En el caso del GWR, una función habitual es la siguiente: 


wí(u,v) 



(20.3.5) 


donde d es la distancia entre las coordenadas de la observación y (u,v), y h es 
la anchura. Este parámetro es el equivalente al radio máximo de influencia que 
veíamos para el cálculo de densidad empleando un núcleo gaussiano. La figura 
20.9 muestra el empleo de una función como la anterior. 



Figura 20.9: Función de ponderación para la estimación de parámetros en el método 
de Regresión Ponderada Geográficamente (GWR). 


20.4. Evaluación multicriterio y combinación de capas 

La combinación de capas es una operación muy habitual. Diferentes variables, 
cada una de ellas recogida en una capa, se combinan para obtener algún tipo de re- 
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sultado en base a la información que representan. Dentro de un SIG, conocemos ya 
operaciones de combinación de capas tanto en formato ráster (mediante el álgebra de 
mapas y sus funciones focales) como en formato vectorial (mediante operaciones de 
solape). Es, no obstante, con las primeras con las que podemos plantear expresiones 
complejas que incorporen esas variables, tal como, por ejemplo, la Ecuación Uni- 
versal de Pérdidas de Suelo (USLE) que vimos en su momento en el apartado 14.1. 

En algunos casos, como el de la USLE, partimos de una formula definida en la 
que no cabe modificación alguna (este es el caso habitual con fórmulas empíricas 
o de base física) . La formula contiene una serie de variables y cada una de estas 
se encuentra recogida en una capa. Basta aplicar dicha fórmula mediante una 
operación local del álgebra de mapas, y el resultado es una capa con la variable 
resultante de dicha fórmula. 

En otras ocasiones, la fórmula no viene definida de antemano, sino que dis- 
ponemos de una serie de variables que tienen influencia sobre un determinado 
fenómeno y necesitamos combinarlas para obtener una nueva variable que nos 
aporte información sobre ese fenómeno. El objetivo es agregar las variables de las 
que disponemos, como factores implicados en el proceso que analizamos. 

Esta última situación es muy habitual dentro de un SIG, en los denominados 
procesos de evaluación multicriterio. En estos, se dispone de una serie de paráme- 
tros que afectan a un determinado fenómeno, y se pretende evaluar la medida en 
que afectan y condicionan al mismo, para de este modo estudiarlo y, en la mayoría 
de los casos, tomar decisiones en función de los resultados obtenidos. Cada una 
de las variables que influyen se recoge de forma habitual como una variable en 
una capa independiente, y se debe en primer lugar juzgar cómo los valores de cada 
variable afectan al fenómeno, y después combinar todas esas afecciones en una 
única variable que sea la que ayude en la toma de decisiones. 

La evaluación multicriterio es la base de, por ejemplo, el análisis de idoneidad, 
un análisis muy frecuente en el ámbito SIG, y en el cual se pretende localizar 
dentro de una zona de estudio los mejores emplazamientos para una determinada 
actividad. Cada uno de los factores que influyen en el desarrollo de dicha activi- 
dad son valorados de forma independiente, y después conjugados mediante una 
expresión matemática. 

Estas formulaciones incorporan elementos probabilísticos diversos, y existe 
un gran número de metodologías para formular los modelos que nos llevan a 
evaluar la idoneidad de cada localización. Será en estos elementos en los que nos 
centremos en este apartado del capítulo, con objeto de extender la potencialidad 
del álgebra de mapas para la realización de este tipo de operaciones. Aunque una 
aplicación fundamental de todos ellos es la evaluación multicriterio (y por ello 
están incorporados en este apartado), tienen utilidad también en otro tipo de 
modelos, tales como, por ejemplo, modelos de predicción de cambios en el uso de 
suelo, también frecuentes en el campo de los SIG. 

En líneas generales, presentaremos formulaciones que nos permitan combinar 
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las variables de forma más elaborada, para poder crear modelos geográficos de 
cualquier índole (como por ejemplo los modelos de idoneidad mencionados) y más 
precisos que los que pueden obtenerse con los elementos que hemos visto hasta 
el momento. 

Dos son los apartados en los que ampliaremos nuestros conocimientos sobre 
la elaboración de modelos como los anteriores: 

■ La creación y preparación de las capas que reflejan los distintos criterios a 
aplicar 

■ La forma de combinar esos criterios en una expresión matemática. 

20.4.1. Creación de capas a combinar 

A la hora de plantear un modelo con diferentes variables y criterios, necesitamos 
expresar de forma numérica el valor de esos criterios que posteriormente agregare- 
mos. En el caso de un modelo de idoneidad, por ejemplo, necesitamos crear una capa 
que nos diga si la actividad puede o no llevarse a cabo en función de cada criterio. 

Como vimos en el capitulo dedicado al álgebra de mapas, además de las opera- 
ciones aritméticas podemos aplicar de igual modo operaciones lógicas a la hora de 
combinar varias capas. Este tipo de conceptos lógicos también estaban implícitos 
en las operaciones de solape entre capas vectoriales, según también vimos en su mo- 
mento. Nos servían, por ejemplo, para eliminar de una capa todas las zonas a menos 
distancia de un cauce que el Dominio Publico Hidráulico (DPH) de este, de tal modo 
que restringíamos las zonas donde podíamos establecer una edificación a aquellos 
puntos fuera de dicho DPH. Esa distancia la calculábamos realizando un área de 
influencia, proceso que podríamos de igual modo llevar a cabo con capas ráster. 

Ese era un modelo de idoneidad muy sencillo, con un único criterio: la distancia 
al cauce. Esta distancia daba lugar a dos posibles estados: o bien un punto está 
dentro del DPH (no se puede construir en él), o bien está fuera (se puede construir 
en él). Las operaciones lógicas nos sirven para expresar esto, y mediante ellas 
podemos desarrollar nuestro modelo. 

No obstante, y sin necesidad de añadir más criterios que compliquen el modelo 
(es decir, sin necesidad de que la evaluación sea multicriterio, sino por el momento 
monocriterio) , podemos encontrar situaciones en las que la lógica booleana no 
refleja con suficiente precisión un criterio dado. Sigamos utilizando el criterio de 
distancia, pero en este caso supongamos el siguiente caso: buscamos un lugar 
donde emplazar una fabrica y conocemos el emplazamientos del principal núcleo 
urbano. En este caso debemos igualmente mantenernos alejados de la ciudad para 
evitar las afecciones que la fábrica puede causar sobre ellas. Por otra parte, sin 
embargo, no interesa situarla a demasiada distancia, ya que entonces será muy 
costoso acceder a los servicios de las ciudades. 

Igual que en el caso anterior, podemos definir una distancia fija por debajo de la 
cual no debemos construir, y añadir además una distancia límite por encima de la 
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cual tampoco resulta rentable económicamente hacerlo. De esta forma, planteamos 
nuestro sencillo modelo aunque, como veremos, es fácilmente mejorable. 

Supongamos que establecemos esa distancia mínima en 4000 metros y la máxima 
en 15000. Un punto situado a 4001 metros es perfectamente viable, mientras que uno 
a 3999 no lo es. De igual modo, ese punto situado a 3999 metros es igual de inviable 
que uno situado a tan solo 2 metros, y puntos a 4001 metros y 14999 metros son igual- 
mente viables, sin que exista distinción entre ambos. Estos casos no parecen muy ló- 
gicos a primera vista, y esto es debido a que, en realidad, no existen solo dos posibles 
clases como estamos planteando en el modelo. Un punto puede ser no solo adecuado 
o no adecuado , sino que existe toda una gama de posibles categorías tales como muy 
adecuado , poco adecuado , completamente inviable o adecuado pero casi inviable. 

En el caso del DPH, este criterio plantea una restricción. A efectos de este 
criterio no importa el valor de la distancia, sino tan solo si es mayor o menor que 
el umbral, que es lo que, en base a la legalidad vigente, nos permitirá construir o 
no. En el ejemplo que ahora proponemos, sin embargo, no tenemos una restricción, 
sino una variable que condiciona, y este condicionamiento puede darse a diferentes 
niveles, presentando más de dos alternativas posibles. 

Un caso similar lo podemos encontrar si tenemos un MDE y conocemos la altitud 
a la que aparece una determinada especie de planta. Esta altitud vendrá definida por 
un limite inferior y uno superior, pero ello no quiere decir, lógicamente, que un me- 
tro por debajo de la cota inferior o un metro por encima de la superior sea imposible 
encontrar dicha especie, ni que dentro de ese rango óptimo sea igual de probable en- 
contrarla con independencia de si nos situamos cerca o no de los límites establecidos. 
Para reflejar este hecho necesitamos, igual que en el caso anterior, poder expresar 
que no solo existen zonas óptimas o inviables para una especie, sino que pueden exis- 
tir otras zonas adecuadas o zonas poco adecuadas pero no completamente inviables. 

Como vemos, el lenguaje natural nos ofrece una variedad de posibilidades 
que la lógica booleana, con su binomio verdadero/falso no nos ofrece. El objetivo 
es, pues, trasladar toda esa gama de posibilidades a una forma compatible con 
el manejo de capas dentro de un SIG y con la realización de operaciones entre 
conjuntos, del mismo modo en que lo hacíamos al aplicar el álgebra booleana. La 
solución a esto es la denominada lógica difusa. 

La lógica difusa pretende acomodar las ideas anteriores al ámbito matemático, 
y que las operaciones lógicas no solo se basen en sí (verdadero) y no (falso) , sino 
también en opciones intermedias ( quizás ) 3 Esto nos va a permitir desarrollar 
modelos más precisos, y nos dará la posibilidad de aplicar las herramientas alge- 
braicas que ya conocemos, más potentes en este sentido que las operaciones lógicas. 

3 Esta es una definición muy informal de la lógica difusa, la cual puede definirse con todo el 
rigor matemático necesario. No obstante, un enfoque más riguroso excede las necesidades de este 
apartado, y aquí veremos tan solo la aplicación más práctica de las ideas básicas, orientando estas 
hacia su utilización dentro de un SIG. Información mucho más extensa y definiciones rigurosas 
sobre lógica difusa pueden encontrarse en [356, 357] . 
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Además, podremos aplicar los elementos que veremos en la siguiente sección, para 
combinar las capas que gracias a la lógica difusa obtendremos. 

Básicamente, la idea es que, si antes expresábamos esa naturaleza verdadera 
o falsa de un elemento con total probabilidad (cuando era verdadero existía una 
probabilidad del 100% de que la planta se diera a esa altitud, y cuando era falso 
esa probabilidad era del 0%) , ahora queremos que los valores de probabilidad no 
sean un conjunto finito de dos elementos, sino que puedan situarse en todo el rango 
de valores posibles. 

La idea de esa variable «difusa» que queremos obtener es similar al de proba- 
bilidad, y ambas se expresan como un valor entre 0 y 1, aunque conceptualmente 
presenten diferencias. La probabilidad nos expresa en qué grado resulta factible 
que se produzca un fenómeno (por ejemplo, qué probabilidad hay de que aparezca 
una especie de planta en función de la altitud), mientras que la variable difusa nos 
expresa una incertidumbre acerca de la pertenencia de un elemento a una clase (por 
ejemplo, en qué medida un punto, en función de su distancia a una ciudad, puede 
incluirse dentro de los puntos viables para establecer una fábrica) . Este tipo de varia- 
bles resultan, por tanto, de utilidad siempre que las clases con las que trabajamos no 
tengan una frontera bien definida, sino que exista una transición continua entre ellas. 

Este análisis resulta similar en cierta medida a lo que veíamos en el apartado de- 
dicado a los clasificadores suaves, donde teníamos distintas capas que nos indicaban 
la pertenencia de un elemento a cada una de las clases definidas. La clasificación 
suave nos muestra los pasos intermedios de un proceso completo, el de clasificación, 
en el cual a partir de las variables de partida, se obtiene una capa resultante. 

Como indica [358], existen dos formas de plantear estos modelos: por un lado, 
tratar las variables por separado y después agregarlas, o bien establecer un plantea- 
miento holístico que trate todas estas variables como un conjunto. La clasificación 
está en este último grupo. Las operaciones que vemos dentro de este apartado se 
encuentran, sin embargo, dentro del primero. 

Un elemento clave en la lógica difusa son las funciones que nos permiten calcular 
los valores de la variables difusa (es decir, aplicar el criterio concreto sobre cada 
variable). Puesto que el valor de esta nos indica la certidumbre con la que podemos 
afirmar que un elemento es miembro de una clase dada, las anteriores funciones 
se conocen como funciones de miembro. A partir de un valor dado asignan uno 
nuevo entre 0 (se sabe con certeza que el elemento no pertenece a la clase) y 1 (se 
sabe con certeza que sí pertenece a la clase) . 

Por ejemplo, para el supuesto de utilizar la distancia a una ciudad como variable 
base, una posible función de miembro es la mostrada en la figura 20.10. 

Para definir esta función de miembro, se han establecido, además de los valores 
límite, un rango de valores óptimos (entre 6000 y 10000 metros de distancia), que 
son los que delimitan las zonas idóneas para situar nuestra fábrica. En este rango, 
se tiene un valor 1. Desde los valores óptimos, los valores descienden, haciéndolo 
de tal modo que toman un valor igual a 0,5 en el punto en el que situábamos los 
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Figura 20.10: Un ejemplo de función de miembro. En trazo punteado, aspecto de una 
función de miembro que asignara tan solo valores verdadero y falso 


valores límite. Esto es lógico si pensamos que hay que definir un punto umbral a 
partir del cual considerar si el elemento está dentro o fuera de la clase (para así 
tener la clasificación dicotómica de verdadero y falso) , y ese punto resulta natural 
establecerlo en la mitad del intervalo. 

Junto con la gráfica de la función de miembro anterior, se muestra la forma 
que tendría una función de miembro 4 que se comportase igual que si operáramos 
con los elementos del álgebra booleana, restringiendo los valores posibles a dos: 
verdadero y falso. Esta función presenta un salto brusco del 0 al 1, de tal modo 
que no es posible asignar ninguno de los valores intermedios. Para cualquier valor 
dado, el nuevo valor que se obtiene al aplicar esta función es, o bien 0, o bien 1. 
El salto de la función se produce exactamente en los valores límite, justamente 
donde la verdadera función de miembro toma el valor 0,5. 

La diferencia entre los resultados que se obtienen al aplicar una función de 
miembro como la anterior y aplicando una mera clasificación en dos clases de 
distancia pueden apreciarse en las capas de la figura 20.11. Junto con una capa 
de distancia a un punto dado, se muestran las resultantes de, en base a dicha capa, 
aplicar un criterio en forma de restricción con dos clases posible (zonas dentro 
del intervalo óptimo vs. zonas fuera del intervalo) o bien creando una variable que 
refleje la certidumbre de pertenencia a cada una de las clases anteriores. 

La función de miembro puede ser cualquier función, y no necesariamente similar 
a la que se muestra en la figura 20.10. Basta con que cumpla las siguiente condiciones: 

■ Estar acotada entre 0 y 1 

■ Asignar valor 1 a los elementos que indudablemente pertenecen al conjunto 
o clase 


4 Realmente no es una función de miembro, ya que no cumple las características de una de 
ellas, pero la denominaremos así para facilitar la comprensión de esta parte. 
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Figura 20.11: a) Capa de distancias a un punto, b) Separación en dos clases de viabilidad 
en función de la pertenencia a un intervalo óptimo de distancia (en blanco zonas viables, 
en negro zonas inviables), c) Certidumbre de pertenencia a la clase viable aplicando la 
función de miembro de la figura 20.10 


■ Presentar un descenso «suave» desde los elementos con valor 1 hasta los 
restantes. 

Es habitual, no obstante, encontrarnos con situaciones como las anteriores, 
en las que tengamos dos rangos, uno para el óptimo dentro del cual tendremos 
valor 1 (sea este rango acotado por los valores b y c, b < c), y otro más amplio 
que abarca todos los valores distintos de 0 (entre los valores a y d, a < d) . En esta 
situación, lo único necesario es definir las transiciones desde el óptimo hasta los 
límites exteriores, es decir, los descensos suaves anteriormente citados. 

En el ejemplo de la figura esta transición es lineal, y la función de miembro 
se puede definir de la siguiente manera: 


f(x) = < 


0 si x < a 

si a < x < b 

o— a — — 

1 si b < x < c 
c í~ x si c < x < d 

a—c — — 

0 si x > d 


(20.4.1) 


Pueden elegirse cualesquiera valores para los parámetros a,b,c y d, obtenién- 
dose toda una familia de curvas distintas. Por ejemplo, el intervalo óptimo puede 
reducirse a un único punto ( b = c ), en cuyo caso tendríamos una función triangular. 

Otra solución habitual es emplear una función sigmoidal para las transiciones, 
quedando la definición global de la función de miembro como sigue: 


0 


si x<a 


(l+coe^fEf)) 

si a < x < b 

1 


si b<x<c 

1 

(l+cosfrfe)) 

si c < x < d 


. 0 si x > d 


f(x) = < 


(20.4.2) 
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Un función de distribución de probabilidad gaussiana (esto es, una campana 
de Gauss), también puede utilizarse como función de miembro. En este caso, el 
óptimo sería el punto que coincide con la media de dicha distribución. 

20.4.2. Métodos de combinación de capas 

A la hora de plantear un modelo, utilizaremos habitualmente no una única capa 
como en los ejemplos anteriores, sino un conjunto de ellas, pues serán con seguridad 
varios los factores que influyen en el fenómeno que estudiamos. Si pretendemos 
buscar el emplazamiento de una fábrica, la distancia a la ciudad más próxima 
condiciona la idoneidad de cada localización, pero también lo harán el tipo de 
suelo, el uso de suelo, la pendiente, y otra serie de factores. 

De igual modo, la probabilidad de que una especie aparezca en un determinado 
punto depende de la altitud, pero también de la insolación o las características 
del suelo, entre otros factores. Cada uno de ellos se pueden tratar por separado, y 
obtenerse capas como las que hemos obtenido en el apartado anterior, con valores 
entre 0 y 1, que indiquen un valor de probabilidad o bien la pertenencia a un 
conjunto difuso. Con todas estas capas es con las que debemos plantear el modelo, 
agregando la información que nos suministran en una nueva variable. 

Las operaciones algebraicas más sencillas nos dan una primera herramienta 
para esa agregación. Estadísticos como la media aritmética, la media armónica, 
o los valores máximo o mínimos del conjunto pueden servir para combinar en un 
único valor los valores de los distintos criterios [359] . 

La mera suma de los distintos valores es empleada también con frecuencia. Si 
los valores representan probabilidades, esta suma corresponde al operador O. Si 
en lugar de la suma empleamos el producto, esto es equivalente a la operación 
Y, es decir, la intersección de los conjuntos (estas operaciones tienen el mismo 
significado si las aplicamos sobre elementos verdadero /falso codificados con valores 
0/1, es decir, si la combinación es en esencia booleana). 

Una opción más elaborada es una media ponderada de los distintos factores, 
de la forma 


Y.i=n Na i x i 

Ei= n Nai 

Esta es una solución habitual en la evaluación multicriterio [358] . 

Además de estos métodos, existen otros que, según las circunstancias, pueden 
resultar más adecuados para una correcta combinación de los factores considerados. 
Entre ellos, encontramos la denominada regla de Dempster. En el caso de aplicar 
una media ponderada como la de la ecuación 20.4.3, la elección de los pesos a¿ no 
es trivial, especialmente cuando el número de factores es elevado. La metodología 
de Jerarquías Analíticas, que también veremos, nos ayudará a establecer dichos 
pesos de forma coherente con la importancia de cada factor. 


(20.4.3) 
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Regla de Dempster 

La regla de Dempster esta basada en la denominada Teoría de la Evidencia , 
una extensión de la teoría bayesiana de la probabilidad [360] . 

El elemento básico para agregar las distintas evidencias dentro de esta teoría es 
la regla de Dempster. La característica principal de esta regla es que, al contrario 
que el producto de las probabilidades, no disminuye a medida que se agregan más 
y más factores (en el producto, por ser la probabilidad siempre menor que 1, sí 
sucede así). En particular, si se agregan dos valores mayores que 0,5 el resultado es 
mayor que ambos. Si se agregan dos valores menores que 0,5 el resultado es menor 
que ambos. Si uno es mayor y otro menor, el resultado es intermedio entre ambos. 

La expresión de la regla de Dempster es la siguiente: 

m ( 7] _ EmipQm 2 (y) cuando (XnY) = Z 
l — J^mi(X)m 2 (Y) cuando ( ÁTl F ) = 0 

Las probabilidades se denotan con la letra m (de masa ) y se conocen como 
Asignación de Probabilidad Básica. 

Veamos un ejemplo concreto. Supongamos que en base a la altitud sabemos 
que existe una probabilidad igual a 0,6 de que aparezca una especie en una zona 
dada, y que en función del suelo dicha probabilidad es de 0,8. Se tiene así que 

■ m±(X) =0,6 (posibilidad de que aparezca según la altitud) 

■ m\(Y) =0,4 (posibilidad de que no aparezca según la altitud) 

■ m 2 (X) = 0,8 (posibilidad de que aparezca según las características del suelo) 

■ 717.2 (F) = 0,2 (posibilidad de que no aparezca según las características del 
suelo) 

Aplicando la ecuación 20.4.4, se tiene 


m(Z) 


1 - (mi(X)m 2 (F) +m 2 (X)m 1 (Y)) 

Oí 48 = 092 

1 — (0,12+0,36) 


(20.4.5) 


La Teoría de la Evidencia es mucho más compleja que lo mostrado aquí, y ad- 
mite casos mucho más elaborados que el presentado. Simplemente se ha mostrado 
un ejemplo para comprender las propiedades de la regla de Dempster, pero el lector 
interesado en profundizar en el tema puede encontrar en [360, 361] exposiciones 
más detalladas al respecto. Más ejemplos de la regla de Dempster y de numerosas 
variantes de la misma pueden encontrarse en [362] . 


Jerarquías Analíticas 

Una suma ponderada de los distintos factores es uno de los métodos más habi- 
tuales de combinar estos. Si los factores son solo dos, o incluso tres, no resulta difícil 
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Valor 

Descripción 

1 

Misma importancia 

3 

Predominancia moderada de un factor 
sobre otro 

5 

Predominancia fuerte 

7 

Predominancia muy fuerte 

9 

Predominancia extrema 

2, 4, 6, 8 

valores intermedios 

Valores recíprocos 

Valores para comparación inversa 


Cuadro 20.2: Valores de comparación en la metodología de jerarquías analíticas 


asignar los pesos a cada uno de ellos conociendo la importancia relativa que tienen. 
Sin embargo, cuando son más numerosos (lo cual sucede muy habitualmente), asig- 
nar pesos de forma consistente no resulta sencillo, ya que las relaciones uno a uno en- 
tre los distintos factores son demasiadas como para poder tener una visión global de 
ellas. Es necesario para ello recurrir a alguna metodología con cierta sistematicidad. 

La más popular de estas metodologías es la de las denominadas Jerarquías 
Analíticas 5 [363] . En esta metodología, no han de asignarse pesos directamente 
a todos los factores, sino tan solo hacerlo para cada una de las posibles combi- 
naciones entre dos de dichos factores. Puesto que se reduce la ponderación de 
todos los factores simultáneamente a una serie de sencillas ponderaciones entre 
dos elementos, resulta mucho más sencillo establecer la importancia relativa de 
cada factor, a la par que mucho más preciso. 

Los pesos de las distintas parejas de factores se colocan en una matriz de 
dimensiones nxn, siendo n el número de factores que se quieren ponderar. El 
valor en la posición (i,j) representa la ponderación entre el factor i y el factor j, 
esto es, la importancia relativa de este primero frente al segundo. En esta matriz 
(sea M), se cumple siempre que M ij = -ri-, y Mu = 1. 

J-jx 

Existen estudios psicológicos que muestran que no se puede comparar simultá- 
neamente más de 7±2 elementos, y en base a este hecho los autores de esta metodo- 
logía recomiendan utilizar valores entre 1 y 9, según lo mostrado en el cuadro 20.4.2. 

Una vez creada la matriz de comparaciones, el autovector principal de la misma 
contiene los distintos pesos a asignar a cada uno de los factores. 

Veamos un ejemplo. Supongamos tres capas con tres factores, sean a, b y c, y la 
siguiente matriz de comparaciones entre pares de ellos, que describe la importancia 
de cada uno de los mismos frente a los restantes. 


5 En inglés, Analytical Hierarchy Process (AHP) 
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a 

b 

c 

a 

1 

4 

5 

b 

1/4 

1 

1/2 

c 

1/5 

2 

1 


Según la tabla, el factor a es cinco veces más relevante que el c y, consecuen- 
temente, c tiene un quinto de la importancia de a. 

El autovector principal de esta matriz es [0,95018,0,17502,0,25791]. 


Factores y restricciones 

A la hora de combinar una serie de capas, el papel que estas juegan en el modelo 
puede ser bien distinto en función de la variable que contengan. Por ejemplo, 
existiendo una limitación legal a la construcción cerca de un cauce, trabajar con una 
capa de distancia al cauce con las herramientas que acabamos de ver para preparar y 
combinar capas no aporta ninguna ventaja adicional. La distancia no es en este caso 
un factor cuya influencia pueda graduarse, sino una restricción que simplemente 
nos servirá para saber si es posible o no construir en un emplazamiento dado. 

En el caso de las restricciones, las operaciones lógicas con las que trabajába- 
mos son suficientes para excluir aquellas zonas en las cuales no va a ser viable 
desarrollar una actividad, con independencia del resto de variables. En el ejemplo 
de la distancia al cauce para establecer una edificación, no importa que el resto 
de factores sean apropiados y el lugar sea idóneo para edificar. Si la distancia al 
cauce es menor que la establecida por el Dominio Público Hidráulico, no resulta 
viable como emplazamiento. 

Frente a aquellos parámetros que representan restricciones, existen otros que 
afectan a la actividad que evaluamos en el modelo, pero su influencia puede tratarse 
como una variable continua, tal y como hemos visto. La combinación de estos 
mediante operaciones lógicas no es suficiente para reflejar este hecho, y deben por 
ello aplicarse operaciones aritméticas o algunas de las metodologías alternativas 
que hemos visto. 

Esta distinción entre factores y restricciones es importante para una correcta 
integración de todas las capas con las que vamos a trabajar, dándole a cada una 
el papel que le corresponde en el modelo. Se pueden tratar las capas de factores 
por separado y después aplicarles las restricciones, conjugando así los dos tipos 
de parámetros que se consideran en el modelo. 

Las operaciones lógicas pueden evaluarse como operaciones aritméticas, apli- 
cando el operador multiplicación y codificando con valores 0 y 1 los valores lógicos 
verdadero y falso. El ejemplo de la figura 20.12 muestra un supuesto de combinación 
de dos factores y una restricción en un modelo sencillo. 
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Figura 20.12: Combinación de factores y restricciones en un modelo sencillo. Los factores 
a) y b) se combinan para obtener un resultado ponderado d). A este se le aplica después 
la restricción c) para obtener el mapa final e). 


20.5. Análisis de Componentes Principales 

El Análisis de Componentes Principales (ACP, también conocido como trans- 
formación de Kahunen-Loeve o de Hotelling es otra técnica estadística con gran 
importancia dentro de los SIG, en especial, y de modo similar a la clasificación 
(aunque al igual que entonces, no exclusivamente), en el trabajo con imágenes. 

El ACP es una transformación que pretende disminuir la dimensionalidad de 
un conjunto de variables, reduciendo este a uno más pequeño de forma que se 
pierda la menor información posible. Se trata de «resumir» la información que 
esas variables contienen, pero eliminando partes redundantes como por ejemplo 
las derivadas de la dependencia que pueda existir entre las variables. Se busca, 
pues, eliminar datos sin eliminar información. 

Esta trasformación es útil ya que disminuye el volumen de datos total, faci- 
litando así las operaciones de análisis e interpretación de las variables, así como 
su propio manejo. 

En el ámbito del SIG, trabajamos con frecuencia con muchas capas, y una 
reducción en el número de estas facilita el planteamiento de modelos tales como 
los que veíamos en el apartado anterior. No solo disminuyen los cálculos a efectuar 
y la complejidad de las operaciones, sino que resulta más sencillo interpretar las 
relaciones entre variables cuando estas no se presentan en gran número (recuérdese, 
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por ejemplo, lo que se comentó en el apartado 20.4.2 en relación a la metodología 
de Jerarquías Analíticas) 

En el caso de imágenes con elevado número de bandas (multiespectrales e 
hiperespectrales), vimos en el capítulo 16 que la representación de estas no puede 
hacerse empleando todas las bandas, sino que deben prepararse composiciones 
con, a lo sumo, tres bandas. Reducir un conjunto de muchas bandas a uno de 
tres con la máxima información posible, de forma que ya pueda ser representado 
y analizado visualmente, resulta una metodología más adecuada que elegir tres 
bandas cualesquiera de ese mismo conjunto. Por su propia naturaleza, es probable 
además que esas bandas estén altamente correlacionadas y contengan información 
redundante, o al menos con cierta redundancia de cara al trabajo concreto que 
vayamos a llevar a cabo la imagen en cuestión. 

Por las razones anteriores, las imágenes son un tipo de dato que se presta 
en gran medida a la aplicación de este tipo de transformación, aunque cualquier 
conjunto de capas puede trasformarse de manera similar. 

El planteamiento conceptual de la transformación puede resumirse de la for- 
ma siguiente. Sea un conjunto de n variables. Estas definen un espacio vectorial 
n-dimensional, de tal forma que las características de un elemento dado (en caso 
de una capa ráster será una celda dada) se expresan mediante un vector de n 
elementos de la forma (xi,X2,--,x n ). El ACP busca definir un cambio de base en 
ese espacio n-dimensional, de modo que los vectores de la nueva base guarden 
una relación directa con las direcciones de variabilidad del conjunto de datos. El 
primer vector de la base señala la dirección de máxima variabilidad, el segundo la 
segunda dirección de máxima variabilidad, y así sucesivamente. Eso quiere decir 
que, en esta nueva base, la mayor parte de la información se va a encontrar en 
la dirección del primer vector, y que esta cantidad de información va a decrecer 
paulatinamente según tomamos cada uno de los sucesivos vectores de la base. 

Al aplicar el cambio de base a un vector (xi,X2,---,x n ), se obtiene un nuevo 
vector (xi,X 2 ,...,x' n ), expresado en las coordenadas de la nueva base. Puesto que 
las primeras coordenadas de este nuevo vector se corresponden con las direcciones 
de máxima variabilidad, podemos tomar solo las primeras p coordenadas (siendo 
p < n) y tener un vector de la forma (xi,X2,---,x p ), sabiendo que haciendo esto 
estamos perdiendo poca información a pesar de reducir la dimensión del vector 
original. Estas p coordenadas son los p componentes principales. 

Es importante reseñar que las variables resultantes no tienen significado físico 
alguno aun en el caso de que las variables originales sí lo tuvieran, no pudiendo 
utilizarse en ese sentido del mismo modo que dichas variables originales. 

Aunque resulta de interés tomar las componentes principales y descartar los 
vectores finales de la base, estos también pueden aportar información relevante 
según qué análisis se quiera realizar. La información sobre los ejes principales define 
aquella información que aparece en todas las variables utilizadas. La información 
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restante es la que aparece solo en alguna de ellas. Esto puede utilizarse, por ejemplo, 
para estudiar los cambios producidos a lo largo del tiempo. 

Si tomamos como n variables un conjunto de n medidas de una única variable 
en n instantes, el análisis de componentes nos permite separar la información 
común a todos ellos de aquella que solo corresponde a algunos de los mismos. De 
este modo, podemos analizar una u otra parte de la información según sean los 
resultados que busquemos. 

En [364] y [365] pueden encontrarse dos ejemplos del uso de transformaciones 
de componentes principales en la detección de cambios de uso de suelo a partir 
de series de imágenes. 

Para calcular la matriz del cambio de base que define la transformación, se 
puede partir de la matriz de covarianzas C (ver ecuación 20.2.4) o bien de la matriz 
de correlación p , en la cual los elementos son los coeficientes de correlación de 
Pearson. Es decir, 


Pll 

P 12 

Pin 

P'2 1 

P22 

P2n 

Pnl 

Pn2 

Pnn 


donde p t j se calcula según 


Pij 


a ij 

ViiVjj 


(20.5.1) 


(20.5.2) 


Esta ultima matriz se emplea en lugar de la de covarianzas en caso de que las 
unidades en que se miden las variables no guarden relación entre sí, con lo cual 
no es posible compararlas. 

El siguiente paso una vez se tiene la matriz es la obtención de sus autovalores 
y autovectores 6 7 . Estos autovectores son los vectores de la nueva base, y sus autova- 
lores asociados nos sirven para establecer el orden en que lian de considerarse. Así, 
el mayor autovalor indica que su vector propio asociado es aquel cuya dirección 
es la de la máxima variabilidad, y el de mínimo valor se asocia, de modo similar, 
al vector en la dirección de mínima variabilidad. 

Para más detalles, [51] ofrece información detallada sobre el análisis de com- 
ponentes principales y su uso en el campo de la teledetección. ' 


6 Si necesitas ayuda con estos conceptos matemáticos, la red está llena de textos libres sobre 
álgebra lineal. En [366] puedes encontrar una excelente referencia en español. 

7 Más accesible, una muy buena referencia on-line es [367] 


20.6. Resumen 


En este capítulo hemos visto algunas formulaciones estadísticas más complejas 
y su aplicación particular sobre datos espaciales. 

La clasificación es uno de los procesos de mayor importancia y, pese a estudiarse 
de forma habitual aplicado sobre imágenes, es de gran utilidad sobre cualquier 
tipo de datos. Tomando una serie de n capas ráster, la clasificación asocia cada 
celda a una clase dada, en función de los valores de dicha celda en esas capas. 

Si en el proceso de clasificación se aporta algún tipo de información adicional so- 
bre las características de las distintas clases, el proceso se conoce como clasificación 
supervisada. Si, por el contrario, se generan estas clases sin información adicional 
y simplemente buscando la mayor homogeneidad en las mismas, el proceso se 
denomina clasificación no supervisada. 

Otras formulaciones vistas son las relativas a la combinación de capas. A la 
hora de combinar varias de ellas, podemos realizar operaciones aritméticas sencillas 
(mediante operaciones locales del álgebra de mapas) o aplicar otra serie de formu- 
laciones más elaboradas. Metodologías como las jerarquías analíticas permiten 
establecer ponderaciones más correctas cuando el número de capas a combinar 
es elevado y resulta difícil asignar pesos relativos a las mismas. El significado de 
una capa en una operación de combinación puede ser distinto en función de si 
representa un factor más a considerar en la ecuación, o una restricción en el modelo. 

Por último, hemos visto cómo el método de análisis de componentes princi- 
pales permite reducir el número de variables con los que se trabaja en un modelo, 
reduciendo un conjunto de n capas a uno menor, tomando aquellas que explican 
la mayor variabilidad. Esto es de utilidad para establecer modelos de combinación 
entre capas, así como para reducir el volumen de datos en imágenes. 




Parte IV 
La tecnología 




Capítulo 21 


Introducción. ¿Cómo son las aplicaciones SIG? 


Las aplicaciones informáticas que forman parte del ámbito SIG son muy diversas, y su 
evolución es constante. En este capitulo presentaremos los tipos principales de aplicaciones 
y la forma en que estas van desarrollándose dentro de dicho ámbito SIG, y el papel que 
juegan en este. 

Todos estos tipos de aplicaciones no son elementos aislados, sino que se relacionan entre 
sí y dependen en muchos casos los unos de los otros para cobrar sentido como herramientas 
útiles. El objetivo del capítulo es presentar una visión global de esa realidad, mostrando 
los distintos elementos tecnológicos que pueden encontrarse en un entorno SIG actual. 


21.1. Introducción 

Las aplicaciones SIG son el elemento de trabajo básico dentro de todos aquellos 
que componen el concepto global de un SIG. Una aplicación SIG materializa todas 
las ideas vistas hasta el momento dentro de este libro, y es la herramienta funda- 
mental para el trabajo con datos espaciales, lo cual constituye la tarea primordial 
de un SIG. 

Dentro de la lógica evolución de toda tecnología informática, los SIG se han 
desarrollado de forma muy rápida y variada, adaptándose a una realidad, la de 
la propia información geográfica, también en constante evolución en todas sus 
vertientes. Por ello, la idea de aplicación SIG que podía encontrarse en un libro 
equivalente a este hace 10 o 20 años es bien distinta de la que hoy tenemos. De 
hecho, la concepción única de aquel entonces ya no es tal, y actualmente son 
muchas las formas en las que las aplicaciones SIG pueden presentarse. 

Junto con la concepción «clásica» del SIG, todavía presente, existen una serie 
de otras tecnologías que han ido surgiendo paulatinamente, y que incorporan ideas 
y conceptos como los que ya conocemos de capítulos anteriores. En esta parte del 
libro se mostrarán todas ellas en detalle, definiendo así el panorama global de las 
aplicaciones SIG y los usos y funciones principales de cada una de dichas tecnologías. 

Para comprender el papel que juegan las distintas formas de aplicaciones 
SIG que encontramos hoy en día y que trataremos en los sucesivos capítulos, es 
necesario analizar la forma en que han ido conformándose dentro del entorno SIG, 
lo cual haremos en este capítulo. 
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21.2. La convergencia de las aplicaciones en el ámbito 

SIG 

Una de las tendencias principales a lo largo de la evolución de los SIG es a 
la unión de otra serie de aplicaciones o elementos de estas, enriqueciéndose con 
conceptos y funcionalidades que, o bien encuentran en un SIG su aplicación a 
la información geográfica, o bien ya la tenían pero dentro de un marco aislado. 
El SIG actúa como elemento de unión de todas estas tecnologías, y engloba con 
carácter general a aquellas herramientas que de un modo u otro puedan emplearse 
para el análisis y tratamiento de datos espaciales. 

Con esta filosofía, el concepto de SIG ha crecido desde sus orígenes, incorpo- 
rando elementos propios de otras herramientas. Su crecimiento ha sido mayor que 
el de otro tipo de aplicaciones, ya que ha jugado un papel central y articulador, y 
en lugar de únicamente aportar conceptos a estas otras aplicaciones, en su mayoría 
ha tomado prestado de ellas. Dentro de las aplicaciones SIG actuales encontramos 
elementos que provienen, entre otros, de los siguiente ámbitos. 

■ Análisis de imágenes 

■ Diseño asistido por ordenador (CAD) 

■ Bases de datos 

■ Herramientas de diseño gráfico 

Muchos de estos elementos ya se han comentado de uno u otro modo en secciones 
anteriores de este libro, ya que su importancia es más que notable. 

Incluso dentro del propio ámbito SIG, las distintas aplicaciones han ido conver- 
giendo paulatinamente. Las dos formas principales de almacenar la información 
geográfica, ráster y vectorial, conformaban originalmente también la base para las 
distintas aplicaciones, con escaso solape entre estas. Es decir, aquellas aplicaciones 
que podían manejar datos ráster y realizar operaciones con ellos, apenas tenían 
capacidades vectoriales o estas estaban por completo ausentes. Del mismo modo, 
las aplicaciones de corte vectorial no eran capaces de trabajar con datos ráster o, en 
todo caso, con algunas imágenes que podían representarse pero apenas analizarse. 

Esta situación ha ido cambiando y, aunque en diferente forma, un SIG actual es 
capaz de trabajar con ambos tipos de datos con un nivel suficiente de funcionalida- 
des. Poco a poco, todo el conjunto de tecnologías que han ido apareciendo dentro 
del entorno SIG se han ido extendiendo a las distintas aplicaciones, y aunque 
existen tipos bien definidos, estos no constituyen bloques estancos. 

Así, por ejemplo, capacidades como el acceso a servicios remotos han evo- 
lucionado de forma similar a la gestión de datos ráster y vectoriales, en cuanto 
que han dejado de ser tecnologías exclusivas de una serie de aplicaciones para 
pasar a formar parte esencial del conjunto de estas. En el caso particular de estos 
servicios remotos, implicaron el desarrollo de servidores que eran mayoritaria- 
rnente empleados desde aplicaciones Web. Con posterioridad, las aplicaciones de 



Introducción. ¿Cómo son las aplicaciones SIG? 


575 


escritorio, más cercanas al concepto tradicional del SIG, han ido incorporando 
estas capacidades para ofrecer una funcionalidad similar a la de esas aplicaciones 
Web. En la actualidad, la integración de estos elementos va más allá, adaptando 
todas las restantes funcionalidades de esas aplicaciones de escritorio, muchas de las 
cuales no aparecen (todavía) en las aplicaciones Web, al trabajo con datos remotos. 

De este modo, el trabajo actual con datos remotos se va integrando en los SIG 
como un elemento más, del mismo modo que ha sucedido con los distintos modelos 
de datos hasta alcanzar la situación actual en la que se conciben como realidades 
distintas pero fundamentales y complementarias dentro de un SIG. 

Veremos todo lo relativo al uso de datos remotos dentro del capítulo 23, también 
dentro de esta parte del libro. 


21.3. La especialización de las aplicaciones SIG 

Al mismo tiempo que las aplicaciones SIG iban incorporando funcionalidades 
e ideas de distintos ámbitos, surgían tecnologías y productos paralelos enfocados a 
un uso más concreto dentro de un determinado campo de aplicación. El crecimiento 
de los SIG que se produce como consecuencia de ese afán integrador da lugar a 
aplicaciones sólidas y completas, que resultan sumamente versátiles al tiempo 
que complejas. Siendo ya una tecnología base bien desarrollada, pueden comenzar 
a derivarse nuevas aplicaciones SIG que se asienten sobre esa base pero que no 
tengan tal carácter genérico, sino que concreten su campo de actuación y las tareas 
para las que están diseñados principalmente. 

Por una parte, encontramos aplicaciones destinadas al uso en una determinada 
disciplina, en las que la aplicación conserva solo aquellas capacidades que resulten 
de mayor interés para el objeto de esta. Las aplicaciones de este grupo pierden el 
carácter genérico y versátil del SIG, y normalmente integran tecnologías SIG dentro 
del marco de trabajo concreto de la disciplina correspondiente, aprovechando que 
en esta existe información geográfica susceptible de ser aprovechada mediante esas 
tecnologías SIG. 

Por otra parte, encontramos modificaciones guiadas por los propios componen- 
tes de la herramienta, asignando más peso a elementos particulares del sistema SIG. 
De este modo surgen aplicaciones SIG dedicadas fundamentalmente a la gestión de 
datos, otras que se centran especialmente en el análisis, o bien aquellas en las que 
la visualización juega el papel fundamental. Sin olvidar que un SIG es ante todo 
un sistema, aparecen aplicaciones que concentran sus capacidades en un elemento 
de ese sistema. En lugar de entenderse la tecnología SIG como una aplicación que 
engloba a todo el sistema, se entiende ese sistema como un conjunto de aplicaciones 
más especializadas, cada una de las cuales compone una pieza del mismo. 

Esta especialización es de mayor interés para exponer en esta parte del libro 
las distintas tecnologías que actualmente coexisten en el amplio mundo del SIG, 
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y su estructura parcialmente se basa en ese criterio. Las aplicaciones particulares 
enfocadas a una determinada disciplina se mencionarán no aquí sino en la última 
parte del libro, en la que se exponen usos prácticos del SIG en determinados campos. 
Siempre que en estos campos existan aplicaciones específicas con componente SIG, 
estas serán detalladas en el capítulo correspondiente. 


21.4. Tipos de aplicaciones 

Con todo lo anterior, el panorama ante el que se encuentra hoy en día un usuario 
de SIG es sumamente complejo. Existen muchas aplicaciones distintas, y la dificul- 
tad de abordar su uso no es debida a su elevado número, sino a la gran cantidad de en- 
foques diferentes y conceptos distintos sobre los cuales estas se han desarrollado. En 
términos de tecnología, el mundo SIG es rico y variado, y resulta imposible tener un 
conocimiento profundo de todos sus representantes. En función de la actividad desa- 
rrollada, unas u otras herramientas se demostrarán de más utilidad, pero no debe 
olvidarse que todas ellas pueden resultar útiles en cierto modo, pues guardan el de- 
nominador común del trabajo con datos geográficos e información georrefer enciada. 

Podemos distinguir tres grupos principales: herramientas de escritorio, re- 
positorios de datos, y clientes y servidores que permiten en conjunto el trabajo 
remoto con todo tipo de datos SIG. Las herramientas de escritorio son la tecnología 
informática fundamental en el campo SIG. Los repositorios de datos y los clientes 
y servidores han ido cobrando día a día más importancia hasta convertirse en 
elementos fundamentales y muy representativos del mundo SIG actual. Ya conoce- 
mos bastante acerca de las bases de datos, porque debido a su relevancia las hemos 
desarrollado en capítulos anteriores del libro. Los clientes, por su parte, pueden 
presentarse de diversas formas, tanto como aplicaciones Web como integrados 
dentro de las herramientas de escritorio, aunque los estudiaremos junto a los 
servidores, agrupando así las tecnologías Web en un único bloque. 

En los siguientes capítulos veremos las características de estos grupos, así como 
la relación existente entre ellos. Los repositorios de datos no tienen un capítulo 
propio dentro de esta parte, ya que hemos hablado de ellos en partes anteriores 
al tratar las bases de datos, pues así parecía más conveniente dada la importancia 
de estas y la necesidad de conocer algo más acerca de ellas antes de abordar otros 
temas como, por ejemplo, las consultas. 

Juntos a estos tipos de software, encontramos otros de tipo SIG derivados de 
ellos, cuyo principal representante son las aplicaciones adaptadas a dispositivos 
móviles. Por la importancia que están cobrando en la actualidad estas últimas, 
detallaremos también sus características en un capítulo adicional. 

Todas estos elementos conforman el panorama global de la tecnología SIG, con 
un conjunto de interrelaciones similar al definido esquemáticamente en la figura 
21.1. Tanto clientes Web como herramientas de escritorio (en caso de que estas 
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últimas tengan capacidades de cliente) , acceden a los servidores para obtener datos 
y servicios. Los servidores, a su vez, toman datos de los repositorios de datos, al 
igual que pueden hacer las herramientas de escritorio para el trabajo con datos 
locales, algo que los clientes Web no están pensados para hacer. 



F igura 21.1: Clases principales de software SIG y relaciones entre ellas 

21.5. La adaptación de las aplicaciones SIG. El SIG 
como base genérica 

Los SIG han crecido mucho desde su origen y, además de ampliar horizontes 
y mejorar el trabajo con ellos, han añadido numerosas funcionalidades adicionales. 
Como cabe esperar, un SIG actual no solo permite hacer las cosas mejor, sino 
que también permite hacer más cosas. Como herramienta rica en capacidades, un 
SIG puede entenderse como una aplicación preparada para responder a todas las 
posibles necesidades dentro del campo del análisis geográfico. 

Sin embargo, la filosofía actual de las aplicaciones SIG es distinta a la existente en 
los primeros desarrollos, y el objetivo principal de un SIG hoy en día no es el de consti- 
tuir una herramienta que contenga todas las funcionalidades que puedan necesitarse, 
sino una base sobre la que estas puedan construirse. Junto a las funciones básicas de 
edición, manejo de datos y análisis, un SIG permite la adaptación de estas a las ne- 
cesidades concretas de cada trabajo, siendo así una herramienta versátil que puede 
tomar una u otra forma en función de las circunstancias particulares de cada uso. 

La adaptabilidad de SIG es una de sus principales virtudes, y es la que permite 
que puedan desarrollarse útiles válidos para cada caso. Un SIG no es, por tanto, una 
herramienta cerrada con un conjunto de elementos suficiente para dar respuesta 
a todas las necesidades, y la obtención de una herramienta SIG final para un 
determinado trabajo no es un proceso único sino un desarrollo en dos etapas. 

La primera de estas etapas implica el desarrollo del propio SIG como tal, y la se- 
gunda concierne al desarrollo de elementos adicionales que completan la herramien- 





ta según las necesidades propuestas, apoyándose sobre los componentes fundamen- 
tales. Aunque muchos usuarios tendrán suficiente con un SIG en su forma original, 
muchos otros necesitarán desarrollos adicionales, o bien se beneficiarán de ellos 
al poder lograr sustanciales mejoras en comparación con el empleo del SIG básico. 

Debido a este esquema de trabajo, el usuario SIG ha de ser en ocasiones un 
usuario técnico y cualificado, o bien ha de necesitar el concurso de alguien capaz de 
desarrollar sobre un SIG herramientas adicionales. La figura del programador SIG 
es importante dentro de un proyecto SIG, y hace que la gestión de la tecnología 
tenga la misma relevancia que la gestión de los datos o de cualquier otro de los 
restantes componentes globales de un SIG. 

La idea de un SIG como herramienta base es especialmente patente en el caso 
de las aplicaciones de escritorio, las cuales concentran una gran mayoría del trabajo 
desarrollado dentro de un proyecto SIG, lo cual las hace especialmente aptas a 
constituirse como herramientas básicas sobre las que se desarrollan modificaciones 
destinadas a responder a las necesidades del proyecto. No obstante, también otras 
aplicaciones SIG son susceptibles de jugar ese mismo papel. 

En el caso de las aplicaciones Web, estas se adaptan para crear accesos par- 
ticulares a unos datos concretos, de forma que pueden emplearse para dar acceso 
a la información geográfica a través de Internet, y hacerlo de una forma particular 
en cuanto a la apariencia y las funcionalidades ofrecidas. Los servidores se prestan 
de igual modo a ser adaptados en la medida de lo necesario. 

Aunque la presencia de elementos para facilitar esa adaptabilidad (lenguajes 
de programación integrados, arquitecturas escalables, etc.) es general, la aparición 
de alternativas libres competitivas dentro del mercado del SIG ha potenciado más 
aún el desarrollo de herramientas adaptadas, al permitirlo en mayor grado. 

21.6. Resumen 

A partir de la concepción inicial de los SIG como aplicaciones bien definidas 
en las cuales se reunían las funcionalidades principales de estos, se ha desarrollado 
en la actualidad un amplio panorama de aplicaciones bien diferenciadas, las cuales 
podemos dividir en tres grupos principales: herramientas de escritorio, repositorios 
de datos y clientes y servidores. 

Estos tipos de aplicaciones se encuentran interrelacionados y se apoyan unos 
en otros para ofrecer todo el conjunto de capacidades actuales de los SIG. 

Para llegar hasta este punto, los SIG han tomado elementos de otras apli- 
caciones, congregándolos en un único software. Al mismo tiempo, se han ido 
especializando en distintos ámbitos, dividiendo así el total de áreas de posible 
trabajo de este tipo de tecnologías. 

En la actualidad los SIG forman una base genérica sobre la cual se construyen 
herramientas de análisis geográfico adaptadas a distintos fines. 



Capítulo 22 


Herramientas de escritorio 


Las herramientas de escritorio son la forma más «típica» en la que se presentan los 
Sistemas de Información Geográfica, y ofrecen elementos para realizar las tareas básicas 
de un proyecto SIG. En este capitulo veremos sus características principales y los distintos 
tipos de ellas que pueden encontrarse, detallando la utilidad de cada uno. 


22.1. Introducción 

El concepto clásico de un SIG es el de una aplicación completa en la cual se 
implementan herramientas para llevar a cabo las tareas básicas del trabajo con 
datos geográficos: creación o edición, manejo y análisis. Con esta filosofía fueron 
desarrollados los primeros programas SIG, especialmente para el tratamiento 
y análisis de datos geográficos y, posteriormente, para dotar a estos de mayor 
versatilidad, incorporando otras funciones adicionales que facilitaran el trabajo 
con esos mismos datos. Se tienen así las herramientas de escritorio, que son aquellas 
que más se asemejan a la concepción original de los SIG. 

A pesar de que existen, como vimos en el capítulo anterior, otras clases de 
aplicaciones SIG, los SIG de escritorio siguen manteniendo su posición como apli- 
caciones fundamentales, y hablar genéricamente de un SIG implica por lo general 
hacerlo de una aplicación de escritorio antes que de otros tipos de aplicaciones. Por 
otra parte, las herramientas de escritorio son soluciones en general completas que 
cubren la totalidad de necesidades que se presentan en el desarrollo de proyectos 
SIG, y por ello constituyen las herramientas primordiales para llevar estos a cabo. 

22.2. Funciones básicas 

Podemos dividir las funciones básicas de un SIG de escritorio en cinco bloques: 
entrada y salida de datos, visualización, edición, análisis y generación de carto- 
grafía. Una aplicación de escritorio habitual presenta todas estas capacidades en 
cierta medida, aunque no necesariamente con el mismo nivel de imple mentación. 

22.2.1. Entrada y salida de datos 

Ya sabemos que los datos son una parte imprescindible de un SIG, y sin ellos no 
puede desarrollarse actividad con una aplicación SIG. Por esta razón, todas estas 
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aplicaciones deben obligatoriamente implementar capacidades para leer datos y, op- 
cionalmente, para guardarlos. Esta ultima es necesaria en el caso en que el SIG pueda 
generar nuevos datos geográficos (nuevas capas) , pero no en aquellas aplicaciones 
sin capacidades de análisis o edición, donde su empleo no ha de crear nuevos datos. 

Pese a ser de tal importancia, la implementación de las capacidades de en- 
trada y salida es muy variable en unos u otros SIG. Una razón por la que esto 
sucede es el gran número de formatos de fichero distintos, la cual no favorece la 
interoperabilidad, como ya vimos en el capítulo 6. Así, cada SIG es capaz de abrir 
unos u otros formatos de archivo, y mientras que algunos tratan a todos ellos por 
igual, ciertas aplicaciones trabajan en un formato propio con carácter nativo, y son 
capaces de incorporar datos en otros formatos a través de extensiones o funciones 
de conversión entre estos y el formato particular del programa. 

La existencia de librerías y componentes de acceso a datos en los que las 
aplicaciones SIG de escritorio pueden apoyarse mejora la conectividad entre estas 
y aporta cierta homogeneidad en este aspecto. 

Otra diferencia importante en la gestión de los datos es la capacidad de conexión 
a bases de datos o servicios remotos como los que veremos en el capítulo 23 1 . Así, 
algunas aplicaciones tienen únicamente capacidades de abrir archivos, pero no 
de acceder a servicios remotos, mientras que otras pueden acceder a todo tipo de 
orígenes de datos. Las aplicaciones que acceden a servicios remotos entran dentro 
de la denominación de clientes. Los clientes Web que veremos en el capítulo 23 se 
conocen como clientes ligeros, mientras que las aplicaciones SIG de escritorio con 
estas capacidades se denominan clientes pesados, haciendo referencia a su mayor 
volumen y el mayor número de funcionalidades que contienen. La funcionalidad 
que ofrecen en relación al acceso a datos remotos es similar en ambos casos, y la 
trataremos en el citado capítulo 23 con detalle. 

En general, las capacidades de acceso a servicios remotos están en función 
del enfoque de la aplicación, y aquellas fuertemente enfocadas al análisis no sue- 
len presentar tales funcionalidades, mientras que aquellas más orientadas a la 
visualización o las herramientas globales más completas sí que las incorporan. 

22.2.2. Visualización 

La visualización es una función fundamental dentro de los SIG y del trabajo 
con cartografía en general. En este libro, por ejemplo, existe una parte completa 
dedicada a esta materia, pues su conocimiento resulta fundamental para poder 
aprovechar plenamente la información contenida en el dato geográfico. 

Aunque existen SIG que no incorporan capacidades de visualización o estas 
no son muy avanzadas, la gran mayoría de las herramientas de escritorio incluyen 
un gran número de elementos para representar los datos geográficos con los que 

básicamente, estos servicios van a permitir acceder a datos geográficos que no están en nuestro 
ordenador, del mismo modo que accedemos a textos o imágenes a través de un navegador Web 
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se trabaja. En ocasiones, interesa únicamente crear una representación de los 
datos, pero incluso cuando el trabajo con una herramienta SIG está enfocado a 
la realización de un análisis, la visualización y exploración visual de los datos de 
partida es un paso previo. 

En general, la forma de operar con los elementos de visualización es muy similar 
entre soluciones SIG distintas y, a diferencia de lo que sucede con la implementación 
de otras funcionalidades, el manejo es prácticamente igual. Esto sucede no solo ya 
en las herramientas de escritorio que tratamos en este capítulo, sino también en las 
que veremos en el dedicado a las aplicaciones Web, las cuales incorporan también 
capacidades de visualización del mismo tipo. En ambos casos, las herramientas fun- 
damentales presentan una estructura similar y unos conceptos base muy parecidos. 

Esta estructura se compone fundamentalmente de un lienzo sobre el que se 
sitúan las distintas capas de información geográfica, y que el usuario va confor- 
mando añadiendo nuevas capas y editando la forma en la que estas se representan. 
Las capas se sitúan en un orden dado dentro del lienzo, lo que permite establecer 
una jerarquía de representación y así lograr el aspecto deseado. 

Junto a este lienzo existen herramientas de navegación que permiten ampliar o 
reducir la escala, o bien modificar el encuadre (Figura 22.1). Asimismo, se presentan 
todas las funciones que permiten obtener las distintas formas de representación 
que veremos en la parte V, tales como el ajuste de colores o el establecimiento de 
etiquetas en función de los valores asociados a las distintas entidades, entre otros. 



F igura 22.1: Herramientas de navegación fundamentales en el entorno gráfico de un SIG de 
escritorio, a) alejamiento ( zoom out ), b) acercamiento ( zoom in), c) desplazamiento (pan) 


Estas capacidades convierte a los datos geográficos en un elemento activo, pues, 
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a diferencia de un mapa clásico donde no pueden modificarse sus características, 
en un SIG el usuario puede de forma rápida y sencilla elegir qué ve y cómo lo ve. 

Como parece lógico pensar, la visualización ha evolucionado mucho desde los 
primeros SIG, y ha ido progresivamente adquiriendo nuevas capacidades, muchas de 
las cuales solo son posibles con los modernos componentes gráficos de los ordenado- 
res actuales. Así, además de ofrecer mayores posibilidades de personalización, el uso 
del SIG como herramienta de representación permite obtener resultados novedosos 
que añaden nuevas formas de explorar los datos geográficos y trabajar con ellos. 

En el caso más habitual, la representación de una capa en un lienzo de un 
SIG es bidimensional, de la misma forma que se representa en un mapa impreso, 
lo cual se debe tanto a la mayor facilidad de implementación de este tipo de 
representaciones como a la mayor exigencia que otro tipo de representaciones 
presentan en lo referente al equipo (hardware). 

No obstante, la presencia de visores tridimensionales está experimentando un 
gran crecimiento en los últimos años, y se van integrando paulatinamente dentro de 
los SIG para ofrecer una nueva forma de representación. Esta clase de capacidades 
gráficas, inalcanzables en términos de rendimiento para un equipo común hace 
unos años, son hoy día perfectamente utilizables en un ordenador de consumo 
habitual, y aportan una nueva forma de trabajar con los datos geográficos. 

Las funcionalidades de representación 3D aún no se integran completamente 
dentro del entorno de un SIG de escritorio completo, ya que se conciben por lo 
general como un elemento puramente visual y enfocado a la representación como 
tal, mientras que un lienzo 2D cumple su función tradicional de marco de trabajo 
sobre el que se desarrollan las restantes tareas del SIG como el análisis o la propia 
gestión de datos. Aun así, conforme las vistas tridimensionales se van convirtiendo 
en elementos habituales, los restantes componentes del SIG se van coordinando con 
ellas para darles a su vez la capacidad de servir como entornos de trabajo versátiles. 

La presencia de una dimensión adicional hace que las herramientas de nave- 
gación sean más complejas en el caso tridimensional, existiendo ajustes relativos 
a la perspectiva, a los ángulos de visión o a la exageración del relieve, entre otros 
parámetros. Como puede verse más adelante en la figura 22.6, las herramientas 
de control de navegación de un visor 3D (situadas en este caso en la parte superior 
derecha de la figura) , son sensiblemente más complejas que las herramientas base 
del caso 2D, presentadas en la figura 22.1. 

Esta mayor complejidad hace asimismo que puedan existir diversas formas en 
las que las capacidades de visualización 3D se presentan en un SIG. Las represen- 
taciones tridimensionales pueden ser simples representaciones en relieve de una 
capa (Figura 22.2a), o pueden incluir verdaderos elementos en tres dimensiones 
(Figura 22.2b). En el primer caso, la capa no contiene datos de elevación (puede 
ser por ejemplo una capa de usos de suelo), y la representación tridimensional 
se realiza basándose en la información de una capa adicional de elevaciones (que 
denominábamos de 2,5D por no poder representar todo tipo de formas en el 
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espacio). La capa plana se representa en espacio «deformada» para ajustarse al 
relieve existente en la zona que representa. 

En el caso de una representación tridimensional real, los objetos poseen infor- 
mación sobre su forma tridimensional, y junto con las coordenadas que delimitan 
su geometría plana (las geometrías básicas que conocemos: punto, línea y polígono) , 
existen valores adicionales en el eje vertical. De este modo, pueden representarse 
entidades tales como edificios, o una ruta tridimensional que represente la trayec- 
toria de un avión. Asimismo, y como puede verse en la figura, pueden añadirse 
elementos adicionales que aprovechan las capacidades de representación 3D, así 
como etiquetas o incluso elementos interactivos que también actúan en 3D (por 
ejemplo, para la selección de entidades). 



Figura 22.2: Distintas formas de representación 3D de capas de datos geográficos 

Es importante recalcar que la visualización de una capa dentro de un SIG es 
independiente de la información que dicha capa contiene o la forma en que esta se 
almacena. El dato geográfico y su representación van por separado, y el dato en sí no 
define la representación, sino que únicamente sirve como apoyo para esta. Esto es 
particularmente cierto para el caso de capas vectoriales, así como para capas ráster 
que contengan un valor de tipo no gráfico, es decir, aquellas que no sean imágenes. 

Una imagen tendrá el mismo aspecto en todos los SIG en los que se utilice, 
puesto que la información relativa a su representación se contiene, al menos en cierta 
medida, en la propia imagen. Los valores de la imagen representan una intensidad 
de luz y, si las bandas corresponden a la zona del visible, existe asimismo una 
información de colores. Otras imágenes pueden proceder del escaneo de un mapa 
o una fotografía impresa, y en ese caso recogen también los colores de cada píxel. 

Aun en el caso de imágenes con más de tres bandas, en las que no existe una 
correspondencia directa entre los valores y la representación (tal como vimos, por 
ejemplo, en la creación de representaciones en falso color en el apartado 16.4.1), 
puede existir una representación por defecto tomando, por ejemplo, las tres prime- 
ras bandas, y sigue siendo probable que estas imágenes también se vean de igual 
modo en uno u otro SIG (aunque luego ello no implica que dicha representación 
no pueda ajustarse a conveniencia en todos los casos). 
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En el caso de capas vectoriales o una capa ráster tal como un MDE, no existe 
ningún tipo de información acerca de la representación acompañando al dato 
espacial en sí. Los datos necesitan de un esquema de asignación que los convierta en 
elementos visuales (colores, texturas, etc.), pero este esquema es ajeno al dato en sí. 

La labor del SIG relativa a la visualización consiste en «interpretar» los datos 
y convertirlos en representaciones, y para ello se basa en esquemas definidos por 
el usuario. Estos esquemas pueden ser almacenados de forma que en sucesivos 
usos de una capa de datos, esta se represente de una misma forma. No obstante, 
abrir la capa con una aplicación SIG distinta implicará en general perder las 
características definidas para su representación ya que, si bien los formatos de 
datos son relativamente interoperables, no así los formatos en que se almacenan 
los criterios de representación de esos datos. 

Estándares para el almacenamiento de estilos como SLD (Styled Layer Descrip- 
tor ), que veremos en detalle en el apartado 32.5.2, tienen como objeto solventar 
este problema. 

22.2.3. Análisis 

Si hubiéramos de ordenar cronológicamente las distintas funcionalidades que 
un SIG de escritorio presenta, probablemente el análisis fuera una de las primeras. 
Por encima de otras capacidades, los ordenadores han sido y son principalmente 
herramientas de cálculo capaces de realizar operaciones y computar resultados, y 
este ha sido uno de los usos fundamentales relativos al manejo de datos geográficos. 
Otros usos, tales como la visualización, pese a ser prácticamente imprescindibles 
hoy en día, estaban muy limitados en los primeros SIG. No ocurría así en el ámbito 
del análisis ya que, aunque con capacidades como es lógico menores que las actuales, 
los ordenadores ofrecían una potencia de calculo que los convertía en herramientas 
de análisis tan interesantes como en la actualidad. 

La tendencia actual en los SIG es considerar las capacidades de análisis como 
herramientas modulares que se ejecutan sobre una plataforma base, la cual com- 
prende las capacidades de visualización y entrada y salida de datos. Todas estas 
capacidades de análisis son independientes entre sí, aunque pueden coordinarse 
y emplearse en conjunto para alcanzar un resultado concreto. De otro modo, cada 
una de las formulaciones o algoritmos que vimos en capítulos anteriores aparece 
dentro del SIG como una herramienta individual que opera sobre una serie de 
capas y genera un resultado dado, tomando en muchas ocasiones esas capas de 
entre aquellas que se están representando en el SIG, e incorporando asimismo a 
dicha representación las nuevas capas generadas. 

Las herramientas de análisis pueden aparecer igualmente como programas inde- 
pendientes, y el SIG de escritorio ser una herramienta aglutinadora que centraliza es- 
tas, facilitando su uso y la gestión de los datos implicados en los procesos de análisis. 

Cuando las herramientas de análisis utilizan directamente la base del SIG 
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donde se encuentran las capacidades de visualización y manejo de datos, puede 
existir cierto grado de interactividad. Las operaciones de consulta, por ejemplo, 
las cuales vimos en el capítulo 11, son en general de este tipo, ya que el usuario 
puede actuar sobre el lienzo para hacer una selección de modo gráfico. Más aún, esa 
selección puede condicionar los posteriores análisis sobre la capa cuyas entidades se 
seleccionan, ya que los procesos que operen sobre ella pueden restringir su alcance 
a aquellas entidades seleccionadas. 

En caso de no existir este tipo de interacción entre elementos de análisis y 
elementos de visualización y exploración de datos, los procesos de análisis suelen 
constituir utilidades autocontenidas que simplemente toman una serie de datos de 
entrada, realizan un proceso en el que el usuario no interviene, y finalmente gene- 
ran un resultado con carácter definitivo. Este resultado podrá ser posteriormente 
visualizado o utilizado como entrada para un nuevo análisis. 

A modo de ejemplo, podemos analizar el caso particular del cálculo de una 
ruta que conecte una serie de puntos a través de una red (los fundamentos de este 
análisis los vimos en el apartadol9.7). 

Una de las formas de implementar este análisis es aquella que requiere del 
usuario la introducción de la información necesaria (una capa de lineas con la red 
viaria y otra de puntos con los puntos de inicio, paso, y llegada correspondiente- 
mente ordenados) como parámetros que el proceso toma y en función a los cuales 
se genera una nueva capa. El proceso es una tarea perfectamente definida, con 
unas entradas y una salidas, y tras la selección de unas capas de entrada se genera 
un nuevo resultado en forma de otra capa. Este proceso puede implementarse de 
forma aislada del SIG, aunque coordinada con él para lograr mejores resultados 
y una utilización más sencilla. 

Otra forma con un enfoque distinto sería presentando un proceso interactivo 
en el cual se introduce como único parámetro inicial la red viaria. Posteriormente, 
el usuario puede operar sobre el lienzo en el que esta se encuentra representada 
para ir definiendo y editando la lista de puntos de paso. El cálculo se va efectuando 
cuando se produce algún cambio en la misma y debe aplicarse de nuevo el algoritmo 
pertinente para adaptar el resultado — la ruta óptima — a ese cambio. 

Este tipo de formulaciones interactivas son más intuitivas y agradables de usar, 
pero en realidad menos productivas de cara a un trabajo dentro de un proyecto SIG. 
Aparecen por ello en aquellas funciones que tienen una mayor componente visual 
o, especialmente, en las que representan un análisis puntual que se realiza de forma 
común como algo individual. Estos son los análisis que se implementan en las aplica- 
ciones que veremos más adelante como parte del grupo de SIG enfocados a la explora- 
ción visual de datos geográficos, que además de esta proveen alguna serie de utilida- 
des de análisis, pocas en general, sin que estas estén concebidas para un trabajo com- 
pleto en un proyecto SIG de cualquier índole, sino más bien para un uso ocasional. 

En un proyecto SIG de cierto tamaño, lo más común es que la fase de análisis, 
a la que seguirá una fase también compleja de preparación e interpretación de 
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resultados, y previa a la cual se ha debido llevar a cabo la preparación de los datos 
de partida, comprenda no uno, sino muchos análisis distintos. Estos análisis, a su 
vez, no son independientes, sino que están relacionados entre sí y lo más habitual 
es que definan como tales un flujo de trabajo que comienza en los datos de partida 
y desemboca en los resultados finales a través de una serie de procesos. 

Por su naturaleza, tanto los datos espaciales como los procesos en los que 
estos intervienen se prestan a formar parte de estos flujos de trabajo más o menos 
complejos, y es por ello que en los SIG actuales una funcionalidad básica es la 
creación de tareas complejas que permiten simplificar todo un proceso de muchas 
etapas en una única que las engloba a todas. La forma anteriormente comentada en 
que aparecen las formulaciones dentro de un SIG, de forma atomizada y modular, 
facilita la creación de estos «modelos» a partir de procesos simples. 

Para entender esta idea, podemos ver un ejemplo aplicado. La extracción de 
una red de drenaje en formato vectorial a partir de un MDE requiere una serie 
de procesos, a saber (para repasar los fundamentos de cada uno de estos procesos 
y comprender mejor la operación global, puede consultarse el capítulo 15, donde 
se describieron en su momento, así como la sección 17.2.1): 

1. Eliminación de depresiones del MDE. 

2. Cálculo de una capa de área acumulada a partir del MDE corregido 

3. Extracción de capa ráster con la red de drenaje a partir de la capa anterior 
y un valor umbral 

4. Vectorización de la capa resultante del paso anterior 

Lo anterior podría simplificarse si se agruparan en una sola operación todos 
los procesos anteriores, de forma que tomando dos datos de entrada (un MDE 
y un umbral), se realizara todo el proceso de forma continua. Las capacidades 
de creación de modelos que implementan los SIG de escritorio (en particular, los 
más enfocados al análisis) permiten crear nuevos procesos compuestos utilizando 
entornos gráficos intuitivos, y estos procesos pasan a formar parte del conjunto de 
ellos de que dispone el SIG, permitiendo que cada usuario «resuma» en procesos 
unitarios una serie de operaciones que, de otro modo, deberían realizarse de forma 
individual con el coste operacional que ello implica. 

Una vez que se ha creado un proceso compuesto, este puede aplicarse sobre 
nuevos datos de entrada, reduciéndose así el tiempo y la complejidad con que 
nuevos parámetros de entrada pueden ser procesados según el esquema de trabajo 
definido en dicho proceso. 

Debe pensarse que el proceso presentado como ejemplo es muy sencillo y única- 
mente implica cuatro operaciones encadenadas de forma lineal. Un proceso de análi- 
sis habitual puede contener muchas más operaciones individuales, y estas disponerse 
de forma más compleja, con dependencia de distinta índole entre sus resultados. 

La imagen 22.3 muestra el aspecto de uno de tales procesos implementado 
en QGIS, un software GIS con capacidad de de creación de modelos. El proceso 
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representado en la figura 7.6 también es un ejemplo de otro tipo de análisis que 
puede adaptarse ventajosamente en este tipo de herramientas de modelización. 



Figura 22.3: Esquema de un proceso complejo creado a partir de operaciones simples 
de análisis con datos SIG. 

Asimismo, las herramientas SIG que contienen funcionalidad de análisis suelen 
permitir el acceso a estas a través de lenguajes de scripting, lo cual facilita la 
creación de flujos de trabajo y la automatización de rutinas complejas de análisis. 
Si bien este trabajo no se realiza de un modo gráfico e intuitivo como en el ejem- 
plo mostrado anteriormente, y requiere mayores conocimientos, la flexibilidad y 
potencia que ofrece es mucho mayor. 

22.2.4. Edición 

Los datos geográficos con los que trabajamos en un SIG no son una realidad 
estática. La información contenida en una capa es susceptible de ser modificada o 
corregida, y las funciones que permiten estas tareas son importantes para dotar al 
SIG de versatilidad. Sin ellas, los datos espaciales pierden gran parte de su utilidad 
dentro de un SIG, ya que se limitan las posibilidades de trabajo sobre estos. Las 
funcionalidades de edición son, por tanto, básicas en una herramienta de escritorio. 

Las operaciones de edición pueden emplearse, por ejemplo, para la actualización 
de cartografía. Como vimos en el capítulo 6, una de las ventajas de los datos digita- 
les frente a los analógicos es la mayor facilidad de actualización. Así, si una entidad 
en una capa vectorial (por ejemplo, una parcela catastral) modifica su geometría, 
no es necesario rehacer todo un mapa, sino simplemente editar ese elemento. A 
lo largo del desarrollo de un proyecto SIG, es muy probable que sea necesario 
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Figura 22.4: División automática de un polígono en dos nuevas entidades a partir de una 
línea. Funcionalidades de este tipo aparecen en los SIG para facilitar las tareas de edición. 


editar de un modo u otro algún dato espacial, bien sea para corregirlo, ampliarlo, 
mejorarlo o sencillamente adaptarlo a las necesidades del propio proyecto. 

Además de la modificación de una capa ya existente, las herramientas de 
edición de un SIG de escritorio se emplean igualmente para la creación de capas 
nuevas, que pueden crearse a partir de la digitalización de imágenes como vimos 
en el capítulo 6, o bien en base a cualquier otra capa de la que dispongamos. 

Aunque las tareas de edición más habituales son las relacionadas con la edición 
de geometrías, no es esta la única edición que puede realizarse dentro de un SIG. 
Podemos distinguir las siguientes formas de edición: 

■ Edición de geometrías de una capa vectorial 

■ Edición de atributos de una capa vectorial 

■ Edición de valores de una capa ráster 

Las herramientas destinadas a la edición de entidades geométricas heredan 
sus características de los programas de diseño asistido por ordenador (CAD), 
cuya funcionalidad principal es precisamente la edición de elementos gráficos. 
Estas incluyen la adición o eliminación de nuevas geometrías, la modificación de 
ellas editando sus puntos (recordemos que toda entidad vectorial se reduce a un 
conjunto de puntos en última instancia), así como otras operaciones geométricas 
básicas. En la sección 6.5.1 vimos algunas de ellas a la hora de tratar la calidad 
de la digitalización en pantalla. 

Otras funciones de edición que encontramos son las que permiten simplificar 
algunas tareas, tales como la división de un polígono. La figura 22.4 muestra cómo 
un polígono puede dividirse en dos simplemente trazando una línea divisoria. Otras 
funcionalidades similares incluyen la eliminación automática de polígonos espúreos 
(véase 18.3.5), o el ajuste automático entre entidades. 

En general, el número de funcionalidades es sensiblemente menor que en el caso 
de los programas CAD, ya que gran parte de ellas no tiene aplicación directa en el 
caso de trabajar con datos geográficos. No obstante, también aparecen herramien- 
tas adicionales, como sucede en el caso de que se registre información topológica, lo 
cual ha de considerarse por igual en el proceso de edición. Así, herramientas como 
la mostrada en la figura 22.4 han de tener en cuenta la existencia de una estructura 
topológica y un modelo de representación particular en el SIG, y no operarán igual 
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en todas las aplicaciones, ya que, como sabemos, no todas presentan las mismas 
capacidades en este terreno. 

Junto con las propias geometrías que pueden editarse según lo anterior, toda 
capa vectorial tiene asociado un conjunto de atributos, y estos deben poder editarse 
también desde el SIG. De hecho, la adición de una nueva geometría a una capa 
vectorial no está completa hasta que no se añaden igualmente sus atributos. 

La edición de toda la información alfanumérica relacionada con las distintas 
entidades se realiza en un SIG a través de elementos tomados del ámbito de las bases 
de datos, siendo esto en general válido tanto en lo referente a las interfaces como en 
el propio acceso a datos. Las operaciones de edición de atributos abarcan tanto la 
modificación de valores sencillos como la de la propia estructura del conjunto de atri- 
butos (adición o eliminación de columnas — campos — en la tabla correspondiente) . 
Por supuesto, la edición de atributos y de geometrías esta íntimamente relacionada. 

Por último, la edición de capas ráster es mucho menos frecuente, y una gran 
mayoría de SIG no permiten la modificación directa de los valores de las celdas. 
Las operaciones del álgebra de mapas permiten modificar los valores de una capa 
y obtener nuevas capas con esos valores modificados, pero editar directamente un 
valor de celda del mismo modo que se editan el valor de un atributo o la posición 
de un punto de una capa vectorial no es una funcionalidad tan habitual. 

Este tipo de capacidades, no obstante, pueden ser de gran utilidad, especial- 
mente en SIG orientados al manejo principal de capas ráster, donde sustituyen 
en cierta medida a las funcionalidades de edición vectorial equivalentes. 

22.2.5. Generación de cartografía 

A pesar de que la representación de las distintas capas de datos espaciales en un 
lienzo es suficientemente potente a efectos de explorar visualmente la información 
que estas contienen, la mayoría de los SIG incorporan capacidades de creación de 
cartografía impresa, generando un documento cartográfico que posteriormente 
puede imprimirse y emplearse como un mapa clásico. Las razones para la existencia 
de tales funcionalidades son muchas, pero la principal sigue siendo la necesidad 
general que aún existe de apoyarse en esa clase de documentos cartográficos para 
poder incorporarlos a proyectos o estudios como parte de anexos cartográficos. 

Aunque la representación dentro de un SIG ofrece posibilidades mayores (cam- 
bio de escala, ajuste de los parámetros de visualización, etc.), disponer de una 
copia «estática» de cada bloque de información con el que se trabaja en un SIG es 
una necesidad ineludible. Más que una capacidad necesaria para la presentación 
adecuada de la información cartográfica, la generación de cartografía impresa 
es en muchos casos la principal razón para el uso de un SIG. Mientras que las 
capacidades de análisis o edición son en ocasiones poco o nada utilizadas, las de 
generación de cartografía son un elemento fundamental, y muchos usuarios la 
consideran erróneamente como la funcionalidad primordial de un SIG. 
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Llegado a este punto del libro, y tras todo lo que hemos visto, queda claro, no 
obstante, que un SIG es ante todo una herramienta de gestión y análisis de datos 
espaciales, y que las capacidades enfocadas a la producción cartográfica deben 
verse como una ayuda — de vital importancia, eso sí — para la presentación final 
de todo el trabajo que se lleva a cabo en él. 

Fundamentalmente, estas capacidades permiten la composición de documentos 
cartográficos de acuerdo con un diseño dado, y la impresión directa de estas en 
algún periférico tal como una impresora común o un plotter de gran formato. En 
la elaboración de dicho diseño, pueden emplearse todos los elementos que habitual- 
mente podemos encontrar en un mapa: el propio mapa en sí (la representación de 
la información geográfica), leyenda, título, escala, etc. Con estos elementos, se crea 
una versión autocontenida de la información geográfica, que puede ya emplearse 
de modo independiente del SIG. 

Las funciones de diseño que se implementan por regla general en un SIG son 
similares a las que pueden encontrarse en un software de maquetación genérico, 
permitiendo la composición gráfica del documento general y el ajuste de los distintos 
elementos que lo forman. Funciones más avanzadas no están presentes de modo 
habitual, principalmente debido a las características muy concretas y bien definidas 
del tipo de documento con el que se trabaja, lo cual hace posible esta simplificación. 

Aunque, como se ha dicho, muchos usuarios, bien por desconocimiento o falta 
de formación en la herramienta, consideran que la capacidad principal de un SIG 
es «hacer mapas», lo cierto es que, incluso en aquellas aplicaciones más completas 
y avanzadas, la potencia en la producción cartográfica es muchas veces insuficiente 
para producir cartografía profesional. Pueden obtenerse resultados de gran calidad 
y sin duda de suma utilidad, pero lo más habitual es no encontrar en un SIG 
las capacidades que se necesitan, no ya únicamente desde el punto de vista del 
cartógrafo, sino desde la perspectiva del diseño. 

La creación de un mapa no es solo una tarea técnica, sino asimismo una labor 
artística, existiendo unas necesidades en función del enfoque que prime. Como 
herramienta de trabajo, un SIG es un elemento técnico, y las consideraciones 
artísticas, aunque pueden en cierta forma aplicarse con las herramientas que este 
implementa, resultan más sencillas de tratar si se dispone de aplicaciones más 
específicas en ese sentido. 

Por ello, lograr un mapa de apariencia realmente profesional requiere unas 
herramientas de diseño avanzado, a la par que un conjunto de utilidades suficiente 
como para poder aplicar a la creación del mapa todos los conceptos sobre repre- 
sentación que veremos en la parte V, no encontrándose estas en ocasiones en su 
totalidad dentro de un SIG. La utilización del SIG como aplicación base y el uso 
posterior de programas de diseño es la solución adecuada para la obtención de 
cartografía profesional, aunque lógicamente requiere unos mayores conocimientos 
y una especialización más allá de la propia práctica cartográfica. 

No obstante, para el usuario técnico de SIG (el usuario al que está dirigido 
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este libro) , las herramientas de diseño cartográfico que la mayoría de aplicaciones 
implementan son más que suficientes, y permiten lograr resultados altamente 
satisfactorios. 

Una de las funciones más interesantes de generación cartográfica en un SIG es 
la automatización del proceso y la simplificación de la producción de grandes volú- 
menes de cartografía. Por una parte, todas las herramientas de escritorio capaces 
de producir cartografía son a su vez capaces de «reutilizar» diseños, de tal modo 
que si un conjunto de mapas tienen unas características comunes (por ejemplo, una 
misma disposición de sus elementos) , no es necesario elaborar todos ellos desde cero. 

Esto permite, por ejemplo, crear una serie de mapas de una misma zona con- 
teniendo cada uno de ellos información sobre distintas variables. A partir de un 
conjunto de capas, se elabora el diseño de un mapa y este se alimenta de dichas capas, 
creando mapas independientes que reflejan estas por separado o en distintas combi- 
naciones. Esto simplifica notablemente el proceso, ya que el diseño ha de realizarse 
una única vez, al tiempo que se garantiza la uniformidad de los distintos resultados. 

Otra aplicación en esta linea es la generación de una serie de mapas que cubren 
en su conjunto una amplia extensión, fragmentando esta en unidades. La gestión 
de los encuadres para cada una de esas unidades, o la creación de un mapa guía en 
cada caso que localice la hoja concreta dentro de la extensión global del conjunto, 
ambas pueden automatizarse junto con las restantes operaciones de diseño. De 
este modo, la producción de toda una serie cartográfica se simplifica en gran 
medida, siendo el SIG una herramienta que supone un gran avance en términos 
de productividad en este tipo de tareas. 

La figura 22.5 muestra un ejemplo de lo anterior. 



Figura 22.5: La automatización de las tareas de creación cartográfica permite simplificar 
la producción de grandes volúmenes de cartografía, como por ejemplo al dividir un área 
geográfica en una serie dada de mapas. 

Estas posibilidades surgen de la separación existente en un SIG entre los datos 
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espaciales y el diseño del documento cartográfico que los contiene, del mismo 
modo que ya vimos existe entre datos y parámetros de representación a la hora 
de visualizar los primeros. 


22.3. Tipos de herramientas de escritorio 

No todas las aplicaciones de escritorio presentan las anteriores funcionalidades 
de igual modo. Es frecuente que ciertos Sistemas de Información Geográfica tengan 
una fuerte componente de análisis, pero que otras de las funciones principales, 
como por ejemplo la edición, no se presenten tan desarrolladas. 

Un caso particular es el de aquellos SIG de escritorio que centran la gran 
mayoría de sus capacidades en el terreno de la visualización, permitiendo un uso 
de los datos geográficos similar al que corresponde a un mapa clásico, donde el 
trabajo con este se basa fundamentalmente en el análisis visual. 

Comenzaremos por estos últimos para dar un breve repaso a los principales 
tipos de aplicaciones de escritorio en función de sus capacidades. 

22.3.1. Visores y exploradores 

Las aplicaciones SIG de escritorio cuya función principal es la visualización se 
conocen generalmente como visores o exploradores , y en la actualidad representan 
una fracción importante del conjunto total de herramientas SIG de escritorio. 

En ocasiones, se trata de aplicaciones en el sentido habitual, las cuales presen- 
tan capacidades reducidas de análisis y edición, y cuyo objetivo no es otro que el 
permitir la visualización de cartografía, sin incorporar las restantes posibilidades 
del SIG. En otros casos, son versiones simplificadas de soluciones SIG de escritorio 
más complejas, desarrolladas como alternativas más asequibles (en términos de 
dificultad de manejo y aprendizaje, y también a veces en términos de coste). 

Una forma también habitual en la que se presentan los exploradores son como 
herramientas de apoyo a unos datos espaciales particulares. Para entender este tipo 
de enfoque, debe pensarse que un mapa clásico puede visualizarse de igual modo 
con independencia del uso que se le pretenda dar y de la experiencia y formación 
de quien lo usa. Con un conjunto de datos espaciales en forma de una o varias 
capas, no sucede lo mismo, ya que estos datos no son un elemento «visual» de por 
sí. Es necesario utilizar un SIG para poder visualizarlos. 

Un usuario experimentado no encontrará problemas en manejar un SIG de 
escritorio complejo, pero un usuario con poca experiencia que lo único que desee sea 
«ver» la cartografía y explorarla visualmente (del mismo modo que un excursionista 
casual puede querer emplear un mapa topográfico) encontrará el entorno de ese SIG 
demasiado complejo y con elementos que, en su mayoría, no le son necesarios. Con 
la disponibilidad creciente de cartografía y la popularización de las tecnologías SIG, 
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este tipo de usuarios ha crecido notablemente, y las aplicaciones adaptadas a sus 
necesidades han ido apareciendo y popularizándose igualmente de forma progresiva. 

Así, existen visores que ocupan un papel secundario como parte de un producto 
compuesto que incluye al propio programa y a los datos en sí. Ejemplos muy claros 
y muy populares son aplicaciones como Google Earth (figura 22.6) , que permite 
que cada usuario incorpore su propia información para visualizar esta, pero cuyo 
mayor interés es el acceso a una enorme base de datos de imágenes de satélite con 
cobertura global. De esta forma, la aplicación puede utilizarse para explorar una 
área deseada, sin necesidad de disponer junto con ella de datos para dicha zona, 
puesto que por defecto la aplicación accede a una base de datos de imágenes que 
van indisolublemente unidos a ella. 



Figura 22.6: Aspecto de un globo o visor tridimensional (GoogleEarth) . 

El usuario puede también añadir sus propias capas y usar estos visualizadores de 
la misma manera que emplea las capacidades de visualización de un SIG de escritorio 
más rico en funcionalidades, pero parte del interés de la aplicación no está solo en sus 
capacidades, sino en los datos que tiene vinculados y que permiten emplear estas. 

En otros casos, un organismo o empresa puede generar un conjunto de capas 
bien a partir de algún tipo de análisis o de cualquier otra metodología, y opta por 
distribuir estas acompañadas de un visor que permita un primer acceso a los datos. 
Todas esas capas podrán ser empleadas dentro de un SIG que soporte los formatos 
de archivo en el que estas se hayan almacenado, pero aquellos usuarios que no 
dispongan de un SIG podrán igualmente efectuar consultas básicas y explorar la 
cartografía haciendo uso del visor incorporado. 

En líneas generales podemos enumerar las siguientes características de los 
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■ Interfaz simple en la que tienen un peso mayoritario las herramientas de 
navegación. 

■ Capacidades de lectura de datos, pero no de escritura. 

■ Reducidas o nulas capacidades de edición y análisis. 

■ Enfocadas a usuarios no especializados. 

Encontramos dos grupos básicos de visores, en función de qué tipo de vi- 
sualización principal incorporan: planos y tridimensionales (globos). Mientras 
que una aplicación SIG de escritorio completa puede presentar los dos tipos de 
representación, y sobre ambas implementar las restantes funcionalidades tales 
como la edición o el análisis (aunque, como ya dijimos, en mayor proporción sobre 
las vistas bi dimensionales), los visores habitualmente reducen sus capacidades de 
representación a una de estas variantes. 

Los visores bidimensionales, aunque sin alcanzar el enfoque especializado de una 
aplicación completa, se orientan más al usuario con cierto conocimiento del ámbito 
SIG, mientras que la tendencia en los tridimensionales es a ofrecer herramientas 
de acceso a datos geográficos con una apariencia atractiva. Ello, no obstante, no 
implica que estos visores carezcan de utilidad en el ámbito científico, siendo igual- 
mente herramientas válidas para todo tipo de investigación o trabajo que incorpore 
cierta componente geográfica. De hecho, la popularización de este tipo de visores 
ha supuesto un gran acercamiento de los datos geográficos y las capacidades SIG a 
toda una amplia comunidad de usuarios, incluyendo los del mundo científico, permi- 
tiéndoles realizar sus trabajos de forma más adecuada. Esto es especialmente cierto 
con aquellos visores que se hallan vinculados a bases de datos particulares, como ya 
se ha comentado, ya que permiten explotar los datos de dichas bases y proporcionar 
a todo usuario un sustrato de información geográfica sobre la que trabajar. 

22.3.2. Soluciones de escritorio completas 

La aplicación SIG más habitual, y la que constituye la herramienta básica para 
el desarrollo de un proyecto SIG, es aquella que reúne en un único producto todas 
las funciones básicas que hemos visto en este capítulo. Con las lógicas diferencias 
en cuanto al grado de funcionalidad de estas según el enfoque de la aplicación, 
una aplicación SIG de escritorio completa debe permitir la lectura de los datos, la 
creación y modificación de estos con sus capacidades de edición, su visualización, 
la realización de análisis con ellos y la generación de resultados cartográficos ya 
sea a partir de los datos originales o de datos generados en los procesos de análisis. 
Con todas estas capacidades, una herramienta SIG de escritorio constituye una 
solución completa para todo tipo de proyectos SIG, y puede dar respuesta a todas 
las necesidades que en ellos se presentan. 

Como ya vimos en el capítulo introductorio de esta parte, y también en el capí- 
tulo 8 dedicado a las bases de datos, la forma de abordar la implementación de las 
distintas capacidades ha ido variando a medida que se iban desarrollando los SIG. 
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En la actualidad, encontramos tanto SIG de escritorio que implementan en una sola 
aplicación central todas las funcionalidades base, como grupos de aplicaciones muy 
interrelacionadas que implementan por separado cada una de dichas funcionalida- 
des. Tanto en uno como en otro caso, existen elementos sobre los que las distintas 
herramientas del SIG se apoyan, especialmente en lo relativo al acceso a datos. 

Pese a que incorporan toda la gama de funcionalidades base, las soluciones de 
escritorio completas no cubren las necesidades de todo usuario de SIG. La convergen- 
cia a la que tienen este tipo de aplicaciones, comentada en el capítulo introductorio 
de esta parte del libro, no ha sido, como ya entonces se mencionó, completamente 
lograda en la actualidad. El problema no es ya un problema de integración de tecno- 
logías, sino una dificultad relativa a la gran amplitud de la ciencia de los SIG. Resulta 
imposible reunir en una sola herramienta todas las capacidades que un SIG de 
escritorio puede incluir, y es por ello que todas las soluciones de escritorio presentan 
algún tipo de especialización, dando prioridad a algún área respecto a las restantes. 

Una división que perdura, aunque en mucho menor medida que en los primeros 
SIG, es la existente entre SIG ráster y SIG vectoriales, especialmente en lo relativo 
al análisis. Un usuario que trabaje con datos espaciales como los correspondientes, 
por ejemplo, a información catastral, utilizará para su labor un SIG de escritorio 
distinto al que usara alguien cuyo trabajo implique mayoritariamente la realización 
de análisis del terreno o la creación de modelos geográficos, a pesar de que ambas 
soluciones probablemente incorporen capacidades tanto en el ámbito ráster como 
en el vectorial. El alcance de estas, no obstante, será distinto en cada caso. 

Incluso en caso de presentar una orientación principalmente hacia los datos 
de tipo ráster, existen también enfoques distintos dependiendo principalmente del 
tipo información que se vaya a manejar. Una división fundamental es la existente 
entre aquellas aplicaciones destinadas al manejo de imágenes y aquellas cuyo 
elemento principal de trabajo son las capas ráster con otro tipo de valores, tales 
como MDE o capas similares. 

Las imágenes, especialmente si se trata de imágenes de satélite, van a constar 
de una serie de bandas cuyo número puede ser muy elevado, lo que requiere unas 
herramientas particulares para su manejo. Asimismo, gran parte de las funciones 
que vimos en el capítulo 16 tales como las relativas a la corrección de imágenes, no 
tienen aplicación para otro tipo de capas (no tiene sentido aplicar una corrección 
geométrica a un MDE o una capa de pendientes, ya que estos datos necesariamente 
provienen de fuentes ya conveniente corregidas), por lo que en cierto modo pueden 
considerarse especificas de este campo, el de las imágenes, si bien es cierto que se 
trata de un campo de gran amplitud. 

Por el contrario, capas como el propio MDE u otras similares solo contienen una 
única banda, y el tipo de operaciones que se desarrollan sobre ellos es bien distinto. 
Con objeto de simplificar estas operaciones, la estructura de estas aplicaciones 
ha de enfocarse hacia alguna de estas variantes, dándole prioridad sobre la otra. 
Por ello, las herramientas de escritorio que se orientan al trabajo con imágenes 


incorporan en general pocas o nulas herramientas en áreas como el análisis del 
terreno, mientras que aquellas que sí tratan estos análisis no incluyen salvo las 
funciones más simples para el manejo de imágenes (realces, ajuste de contraste, 
etc.), pero no las más específicas. 

En realidad, una aplicación de escritorio global que cubriera todas estas 
funcionalidades no sería práctica desde el punto de vista de su uso, pues sería 
excesivamente compleja. Es poco probable, igualmente, que un mismo usuario 
requiera un entorno profesional productivo en todas ellas, y más habitual sin 
embargo que centre su trabajo en un área concreta. 

22.4. Resumen 

Las herramientas de escritorio son la forma más clásica de los SIG. Entendemos 
como tales a aquellas herramientas ciertamente complejas que permiten llevar a 
cabo las tareas básicas de un SIG en sentido tradicional, como son el manejo de 
datos espaciales y el trabajo con los mismos. 

Podemos distinguir cuatro funcionalidades básicas que aparecen representadas 
en mayor o menor medida en un SIG de escritorio: visualización, edición, análisis 
y generación de cartografía. 

En función del grado de desarrollo e implementación en que las anteriores 
funcionalidades se encuentren en un SIG de escritorio, distinguimos distintas 
formas de estas herramientas. La división más genérica es aquella que distingue 
las herramientas pensadas para un trabajo completo en todas las distintas fases 
de un proyecto SIG de aquellas orientadas a la representación y exploración visual 
de los datos geográficos. Estas últimas representan un enfoque más reciente, y en 
la actualidad están contribuyendo de manera muy notable a la expansión de las 
tecnologías SIG fuera del ámbito más especializado. 
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El avance de las redes locales y de Internet ha permitido que se acceda a la información 
geográfica contenida en un SIG utilizando el paradigma cliente-servidor. Para ello es 
necesario contar con componentes en el lado servidor que distribuyan la información 
y componentes en el lado del cliente para acceder a esta. En este capitulo veremos las 
características de ambos elementos y cómo estos responden a las necesidades que el trabajo 
con datos remotos plantea en el ámbito SIG. Enfocaremos particularmente el capitulo a las 
tecnologías de Web Mapping, las cuales permiten incorporar las ideas de los SIG dentro 
de paginas Web, utilizando un navegador Web como aplicación principal. 


23.1. Introducción 

Del mismo modo que podemos acceder a otros tipos de información a través 
de Internet o de una red local, también podemos emplear esta para acceder a 
información geográfica y trabajar con ella dentro de un SIG. En el contexto actual, 
no puede dependerse en un SIG únicamente de datos locales en forma de archivos 
en el mismo ordenador en el que se trabaja, sino que es necesario poder operar con 
datos remotos. Las redes son la vía para la difusión de todo tipo de información, 
entre ella la información geográfica. 

Los datos espaciales pueden ofrecerse a través de una red de la misma manera 
que se ofrecen otro tipo de datos como imágenes o texto en una pagina Web. Para 
que en este proceso se maximicen las posibilidades que esos datos ofrecen, es nece- 
sario disponer de tecnologías adaptadas basadas en las tecnologías fundamentales 
de las redes, pero particularizadas al tipo de datos concreto que se maneja y los 
posibles usos que pueden darse. 

Estas tecnologías son variadas y, como cabe esperar, han evolucionado paralela- 
mente a otras basadas en la Web, añadiendo progresivamente elementos tales como 
una mayor interactividad o flexibilidad Web. Las páginas estáticas que formaban 
Internet hace unos años, muy limitadas en cuanto a sus posibilidades, han dado 
paso a lo que hoy se conoce como Web 2.0, donde encontramos blogs, wikis y otros 
tipos de páginas Web con capacidades mucho mayores y que permiten al usuario 
un trabajo muy distinto. 
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Una evolución similar han seguido las aplicaciones de la Web relacionadas con 
la información geográfica, habiendo ganado día tras día en riqueza hasta el estado 
actual donde pueden llegar a ofrecer casi tantas funcionalidades como un SIG de es- 
critorio. Los mapas estáticos que constituían los primeros elementos con componen- 
te geográfica en la Web han evolucionado hasta verdaderas aplicaciones que pueden 
convertir un navegador Web en una plataforma SIG completa. En su avance, las 
tecnologías Web van tomando elementos que ya conocemos de los SIG de escritorio, 
con objeto de trasladar toda su potencia al entorno de Internet, y uniéndola así con 
las capacidades que la red tiene como espacio común de actividad y conocimiento. 

Aunque el objetivo final sea trasladar los SIG de escritorio a la red, las tecno- 
logías necesarias distan bastante de las tecnologías SIG en sentido clásico, de la 
misma forma que, aun trabajando con un tipo de datos similar, un procesador de 
textos se diferencia mucho de un navegador Web. 

Fundamentalmente, estas tecnologías Web han de responder a dos necesidades 
principales: servir un elemento a través de la red y tomar este para emplearlo. Es de- 
cir, tomar y recibir el elemento que es objeto de interés. Distinguimos así los concep- 
tos de servidor y cliente, que debemos ver con algo más detalle antes de continuar. 


23.2. ¿Cómo funciona Internet? 

Estamos acostumbrados a utilizar Internet a través de aplicaciones tales como 
navegadores Web, y en muchos casos desconocemos cómo se realiza ese proceso 
tan cotidiano hoy en día. Los fundamentos que residen detrás de la consulta de 
una simple página Web son esencialmente los mismos que vamos a encontrar para 
el caso de las tecnologías SIG en la red, por lo que es necesario conocerlos al menos 
someramente para poder entender el proceso que tiene lugar cuando empleamos 
una tecnología SIG en Internet. 

Cuando consultamos una página Web existen tres elementos fundamentales 
que entran en juego: la propia red que hace de nexo entre sus elementos, nuestro 
ordenador que es el que realiza la petición de consulta, y la máquina donde se 
encuentra almacenada esa página que queremos consultar. 

Conocemos como servidor al elemento encargado de servir algún tipo de 
contenido. En el ámbito SIG, se trata fundamentalmente (aunque no con carác- 
ter exclusivo) de datos geográficos, que constituyen el principal producto que se 
distribuye a través de la red dentro de nuestro campo. En el ejemplo anterior, la 
máquina que contiene la página de interés es el servidor. También se conoce como 
servidor el programa que, residiendo en esa máquina, interpreta la petición y la 
procesa, sirviendo así la página. 

El cliente es responsable de pedir ese dato al servidor, tomarlo y trabajar con 
él. Nuestro navegador Web es el cliente en este caso, ya que es el que realiza la 
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petición. Para ello, basta con introducir la dirección Web 1 correspondiente en la 
barra de direcciones del navegador. Al hacer esto, proporcionamos una serie de 
datos que son los que se emplean para realizar el proceso, y que vamos a ver a 
continuación en detalle. 

Supongamos la dirección Web http : / / volaya . es/wr it ing, en la cual puedes 
encontrar información relacionada con este libro e incluso descargarlo. Si visitas 
esa página estás efectuando una petición a través de esa URL, la cual se compone 
de las siguientes partes: 

■ http: El protocolo a usar, que define la forma en que se van a comunicar cliente 
y servidor. Aunque este es el más habitual, existen muchos otros tales como 
ftp o mailto. Puede encontrarse más acerca de estos protocolos en [368]. 

■ volaya . es: Esta cadena identifica la máquina donde reside la página que 
buscamos. Es en realidad una versión más legible para el ojo humano de un 
código numérico que indica la dirección concreta. El navegador lo convierte 
en realidad en algo como 128.118.54.228. 

■ writing: La página que buscamos dentro de todas las que hay en esa má- 
quina. Se expresa como una ruta a partir del directorio raíz del servidor, que 
no es necesariamente el directorio raíz de la maquina servidora. 

El proceso mediante el que podemos ver esa página en un navegador Web 
comprende los cuatro pasos siguientes: 

1. El cliente realiza la petición. 

2. La petición se conduce a través de la red hasta el servidor. 

3. El servidor busca la página y la devuelve a través de la red en caso de 
encontrarla, o devuelve una pagina de error en caso de no tenerla. 

4. El cliente recibe la página y la representa. 

La figura 23.1 muestra un esquema de este proceso. 

23.3. El valor de las tecnologías SIG Web 

Antes de abordar la parte más técnica de las tecnologías Web SIG, veamos el 
significado de estas y la función que cumplen. Entenderemos en este contexto como 
tecnologías Web SIG a todos aquellos elementos que permiten la representación de 
cartografía como un contenido más de una página Web. Esto es lo que se engloba 
bajo la denominación genérica de Web Mapping. 

Aunque este capítulo está dedicado a las tecnologías Web dentro del ámbito 
SIG, y estas incluyen tanto servidores como clientes, las formas en las que se 
presentan los elementos del Web Mapping dependen fundamentalmente del cliente, 
el cual es en general un simple navegador. 

Como vimos en el capítulo dedicado a los SIG de escritorio, estos pueden 
acceder a datos remotos, y para ello necesitan realizar una petición a un servidor 


técnicamente, una dirección Web como esta se conoce como URL (Uniform Resource Locator) 
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Figura 23.1: Esquema del proceso de consulta de una página Web desde un navegador. 


siguiendo el esquema que hemos visto en el apartado anterior. Una vez que los 
datos están en el SIG (es decir, el servidor ha devuelto a este los datos que había 
pedido), podemos operar con ellos usando las herramientas que ya conocemos. 

En un entorno Web sensu stricto tal como el de un navegador, las posibilidades 
son, no obstante, distintas, pues se trata de combinar los elementos cartográficos con 
los restantes elementos que forman parte habitual de una página Web. Las tecnolo- 
gías Web de corte SIG se han desarrollado principalmente para su trabajo dentro de 
un navegador, es decir, como una alternativa a los SIG de escritorio o para alcanzar 
áreas nuevas en el trabajo con información geográfica digital. Su incorporación en 
los SIG de escritorio aumenta las capacidades de estos, pero la principal potencia 
de estas tecnologías surge cuando se unen a otras funcionalidades de tipo Web. 

En resumen, el objetivo básico que pretenden cumplir las tecnologías que vamos 
a ver, especialmente las del lado del cliente, es llevar las funcionalidades de un SIG 
a la Web, para así compartir la potencia de ambos componentes. Las ventajas de 
llevar el SIG a la Web en lugar de incorporar los elementos de esta última en un 
SIG de escritorio tradicional son notables, y existen grandes diferencias entre las 
soluciones que se obtienen en ambos casos. Estas diferencias tienen que ver sobre 
todo con los usuarios y su perfil, así como con el diseño mismo de las aplicaciones. 

Mientras que un SIG de escritorio se orienta principalmente a usuarios más 
especializados, poder dotar a un sencillo navegador Web de capacidades de visua- 
lización o edición de información geográfica hace que estos lleguen a un público 
distinto y abre nuevas posibilidades. Los usuarios avanzados encuentran igualmente 
utilidad en el Web Mapping, que se complementa en muchos terrenos con los SIG 
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de escritorio. Por su parte, los usuarios no especializados, desconocedores de otras 
tecnologías SIG, pueden incorporarse al ámbito SIG a través de las tecnologías Web. 

Algunas de las ideas fundamentales que caracterizan a las tecnologías de Web 
Mapping y su papel actual son las siguientes: 

■ No es necesario un software SIG específico. Al menos, no es necesario 
desde el punto de vista del usuario, que no ha de instalar nada adicional en su 
ordenador. Acceder a cartografía remota e incluso a funcionalidades avanza- 
das basadas en esos datos no requiere más que un simple navegador Web, algo 
presente en cualquier ordenador hoy en día. La barrera que puede suponer 
el trabajar con una aplicación específica se diluye cuando incorporamos las 
capacidades de esta en algo tan habitual como un navegador. 

■ Perfil menos técnico. No solo las aplicaciones están pensadas para su uti- 
lización por parte de usuarios no especializados, sino que la incorporación de 
estos al ámbito SIG hace que la cartografía deje de ser un elemento propio de 
esos usuarios más técnicos. Poniendo al alcance de todos las capacidades de 
edición y creación de cartografía hace que cualquiera pueda generar su propia 
información geográfica no especializada y además ponerla a disposición de 
otros usuarios. 

■ Potenciamiento del trabajo colaborativo. La red es un punto de en- 
cuentro que favorece de forma natural la colaboración. Proyectos como la 
Wikipedia, posibles gracias a esta capacidad de Internet para facilitar el 
trabajo común de múltiples personas, tiene sus equivalentes en el ámbito de 
la información geográfica. Los SIG dejan de ser algo personal reducido al 
ámbito de un ordenador o una pequeña red, para ser algo global en una red de 
muchos SIG Ínter conectados. Y más importante que esto, los datos también 
se hacen globales, pudiendo ser empleados e incluso editados por todos. 

■ Información más actualizada, incluso en tiempo real. La Web es el canal 
ideal para transmitir la información de forma inmediata y flexible. A las venta- 
jas de los datos digitales sobre los analógicos en este sentido, que ya vimos en 
el capítulo 4, hay que sumar que la sencillez de acceso que aporta una interfaz 
Web hace todavía más accesible la información geográfica más reciente. 

■ Independencia del sistema. Un mapa Web puede verse y usarse del mis- 
mo modo en cualquier ordenador, con independencia del sistema operativo, 
el navegador e incluso el dispositivo empleado (PC, PDA, etc.). Si este mapa 
se basa en estándares abiertos, la solución es todavía más interoperable, 
como veremos en el capítulo 32. 

■ Personalización de aplicaciones. Una de las tendencias más importantes 
en el ámbito del Web Mapping es la creación de aplicaciones que personalizan 
una base común para un determinado uso. Sobre una base compuesta por 
un juego de datos genérico (generalmente imágenes de satélite y mapas base 
tales como un mapa de carreteras) y una aplicación SIG, se crean pequeñas 
aplicaciones de forma sencilla, a las cuales se pueden añadir de modo también 
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simple nuevos datos. Estas aplicaciones se conocen como mashups , y una 
vez creadas puede incorporarse a una página Web distinta. Dedicaremos una 
sección completa de este capítulo a desarrollarlas en detalle. 

Mediante uno de tales mashups, un usuario puede crear, sin excesivos cono- 
cimientos sobre SIG, una aplicación particular que ponga sobre ese juego de 
datos general los emplazamientos de, por ejemplo, todos aquellos que visitan 
su página Web. Las posibilidades en este sentido son prácticamente infinitas, 
y proliferan de forma exponencial en Internet. 

■ Combinación de cartografía y otros elementos. Si llevamos las capa- 
cidades SIG a un navegador, además de estas dispondremos en ese navegador 
de muchas otras posibilidades, tales como la representación de elementos 
multimedia (vídeo, sonido, etc.) o el uso de hiperenlaces. El navegador es hoy 
en día la aplicación versátil por excelencia, y ello hace que podamos añadir a 
las capacidades SIG una larga serie de otras funcionalidades no relacionadas 
directamente con la información geográfica, y no presentes en su mayoría 
en los SIG de escritorio. 

La importancia de las tecnologías Web se debe, por tanto, principalmente a un 
razón social y no a una tecnológica, aunque es innegable que las tecnologías nove- 
dosas que se desarrollan en este campo aportan al ámbito SIG posibilidades antes 
desconocidas. Estas nuevas posibilidades enriquecen notablemente los SIG de escri- 
torio si estos implementan las capacidades de acceso a datos remotos, ampliando 
el alcance de ese tipo de aplicaciones. Cuando se implementan, sin embargo, en un 
entorno puramente Web tal como en el seno de un navegador y se crea una página 
Web con elementos SIG, se consigue ampliar el abanico de usuarios potenciales y así 
también crecen las posibilidades y las formas en que el propio SIG puede presentarse. 


23.4. Formas de cartografía en la Web 

Las formas en las que pueden presentarse las tecnologías SIG dentro de un 
entorno Web varían en cuanto a su similitud con los SIG de escritorio, incorporando 
más o menos elementos de los que son habituales en este tipo de aplicaciones. 
Como parece lógico pensar, ha existido una evolución progresiva, de tal modo que 
en la actualidad existen más elementos propios de los SIG de escritorio dentro 
de las tecnologías Web SIG, y la cartografía Web hoy en día permite realizar un 
trabajo más similar al que se desarrolla en un SIG clásico. 

Una primera y sencilla clasificación de los tipos de cartografía Web es la que 
divide esta en mapas estáticos y dinámicos [369]. 

Un mapa estático es simplemente una imagen con información cartográfica, 
la cual no permite ningún tipo adicional de trabajo con ella que no sea la mera 
observación. En este sentido, se asemeja a un mapa clásico, donde el usuario no 
puede interactuar directamente con el contenido del mapa. A efectos de trabajo real, 
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las posibilidades son aún menores ya que acciones tales como mediciones tampoco 
pueden realizarse, ni siquiera con medios mecánicos como el caso de un mapa en 
papel. Junto a esto, la resolución de una pantalla común es mucho menor que la 
que presenta un mapa impreso, con lo que la calidad del mapa no es comparable. 

Este tipo de mapas, por tanto, no responden a las funcionalidades que un 
SIG ha de tener para poder prestar utilidad en el manejo y uso de información 
geográfica, y difieren notablemente de un SIG de escritorio, incluso en la versión 
más básica y primitiva de estos últimos. 

Incorporar este tipo de mapas a una página Web no requiere ninguna tecnología 
particular, y puede llevarse a cabo con elementos genéricos tanto del lado del cliente 
como del servidor, pues el dato realmente no es un dato geográfico como tal, sino una 
mera imagen (y esa imagen no va acompañada de información tal y como su sistema 
de referencia), algo para lo cual cualquier servidor o cliente actual ofrece soporte. 

La figura 23.2 muestra una imagen de una primigenia cartografía Web presen- 
tada a través del visor Xerox PARC Map Viewer. 



Select a point on the eep lo roo» ín <ty 2). or select en option be lo* Please reed Aboul the Map 
Viewer . FAQ and Detai Is . To find a U.S. location Vy niae, see tbe Geographic Nwe Server . 
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t Hide Map le&gc . Eetnevo Map Ir* ge Only . Ho Zoo on Select . 
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Figura 23.2: Visor de mapas Xerox PARC Map Viewer, uno de los primeros en su campo 


Por su parte, un mapa dinámico es aquel que no se compone de una imagen 
inmóvil, sino que esta varía y se adapta en función de los requerimientos del usuario 
o según alguna serie de parámetros prefijados. De acuerdo con esto, los mapas 
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dinámicos pueden ser interactivos o no, dependiendo de si es el usuario quien 
directamente modifica la representación del mapa. 

Como ejemplo de mapa dinámico no interactivo podemos citar mapas animados 
que encuadran una determinada zona y muestran la variación de una variable a lo 
largo del tiempo. Mapas de variables climatológicas o una serie animada de mapas 
que reflejan el avance de un incendio son ejemplos habituales de este grupo. 

Tampoco en este tipo de mapas aparecen las funciones esperables en una 
aplicación SIG, y una vez más no se requieren tecnologías específicas para poder 
incorporar este tipo de elementos en una página Web. 

La interactividad es la que aporta las posibilidades necesarias para comenzar 
a incorporar funciones SIG a la cartografía Web, y sin ella no podemos hablar en 
realidad de tecnologías SIG puramente dichas. 

La forma de interactividad más básica que se implementa en una página Web 
en el trabajo con cartografía es la que permite la modificación de la forma en 
que los datos geográficos se visualizan. Las herramientas que permiten modificar 
la escala de visualización (acercarse o alejarse) y desplazar el mapa, las cuales 
ya nombramos como capacidades básicas en los SIG de escritorio, aportan a la 
cartografía Web muchas posibilidades nuevas. Entre ellas, es de destacar que 
mediante estas herramientas la extensión de los datos no se encuentra limitada 
por la propia extensión de la pantalla o la dimensión del navegador. 

Si se trabaja con imágenes estáticas, trabajar con datos que cubran toda la 
extensión del globo implica hacerlo a una escala de muy poco detalle, pues ha de 
representarse toda la imagen de forma simultanea. Permitiendo que el usuario elija 
la escala de representación y ajuste la extensión con la que se desea trabajar, un 
navegador Web se convierte en una ventana hacia datos que pueden tener cualquier 
extensión y volumen, y hacia el trabajo con ellos de forma dinámica e interactiva. 

Esto es de especial importancia si pensamos que las máquinas que se encuentran 
al otro lado (en el servidor) son ordenadores potentes con gran capacidad, que 
pueden almacenar enormes juegos de datos. Un juego de datos con imágenes de 
todo el mundo a gran resolución ocupa un tamaño que probablemente lo haga 
inutilizable en un ordenador personal (además de que ese juego probablemente 
quede fuera del alcance del usuario de ese ordenador en lo que a su adquisición 
respecta), pero puede perfectamente ser servido desde un potente servidor, sir- 
viendo en cada caso la «porción» de él que cada usuario requiere según utiliza el 
cliente correspondiente. En esto se basan gran parte de servicios y de aplicaciones 
desarrolladas sobre ellos, como veremos más adelante. 

De especial importancia para el desarrollo de estas capacidades ha sido la 
popularización y mejora de las tecnologías que permiten el desarrollo de las deno- 
minadas Aplicaciones Ricas de Internet (RIA) 2 . Este tipo de aplicaciones llevan 
a la Web algunos elementos de las tecnologías de escritorio, y en general permiten 

2 Rich Internet Applications 
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optimizar el volumen de datos necesario para operar con la aplicación dentro del 
entorno del navegador. 

Si no se emplean estas tecnologías, un cambio mínimo en la configuración de 
la pagina por parte del usuario (por ejemplo, modificar el encuadre del mapa en 
una aplicación SIG), requiere la recarga total de la página, de la misma forma que 
sucede cuando hacemos clic en un hiperenlace. En realidad, estamos pasando a 
una página Web distinta. 

En un entorno RIA, sin embargo, se cargan al inicio (en el primer acceso a 
la página) los elementos que constituyen la aplicación en sí, y posteriormente se 
transmiten únicamente los datos que vayan siendo necesarios a medida que el 
usuario opere con la aplicación. Esto mejora notablemente la sensación del usuario, 
ya que este nunca tiene ante sí una pantalla sin contenido mientras se carga la 
página, puesto que esta ya no ha de cargarse de nuevo, y la carga de datos puede 
además realizarse mientras el propio usuario opera. 

AJAX 3 [370] es una técnica de desarrollo muy popular en este sentido, y de la 
que los SIG Web hacen uso habitualmente. La figura 23.3 muestra una comparación 
entre el esquema de una aplicación Web tradicional y una basada en AJAX. 
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Figura 23.3: Comparación entre el esquema de una aplicación Web tradicional y una 
basada en AJAX. (adaptado de [370]). 

Profundizar más en estos aspectos es, no obstante, demasiado técnico para 
el enfoque de este libro, no siendo necesario además para la comprensión de las 
tecnologías Web desde el punto de vista del usuario. Tan solo es necesario dife- 

3 Asynchronous JavaScript And XML 
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rendar entre el comportamiento de una página Web anterior a la introducción de 
estas técnicas, en la cual cualquier interacción (clic del ratón) suponía una recarga 
completa de la página, mientras que en el caso de una RIA, la experiencia es más 
fluida y cercana a la que se tiene usando una aplicación de escritorio. 
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Figura 23.4: Interfaz de TIGER MapServer (año 1997) 

La figura 23.4 muestra el aspecto de una aplicación de Web Mapping previa 
a la introducción de tecnologías como AJAX, en particular la Web a través de la 
que se accedía a los datos del proyecto TIGER, creado por el U.S Census Bureau. 

Además de modificar la zona representada, un usuario debe poder modificar la 
forma en que los datos dentro de esa zona se muestran. Es decir, debe poder cambiar 
el estilo de los elementos representados, variando colores o formas de la misma ma- 
nera que esto puede hacerse en un SIG de escritorio. Asimismo, muchas aplicaciones 
Web permiten la consulta de varias capas de datos, incluso de datos provenientes 
de varios servidores distintos, datos que no necesariamente han de mostrarse todos 
simultáneamente. Igual que en un SIG de escritorio seleccionamos unas u otras 
capas para su visualización y podemos alterar el orden de representación de estas, 
también podemos realizar estas operaciones en una aplicación SIG Web. 

Esto hace que una aplicación SIG dentro de un navegador se convierta en 
una herramienta completa para el acceso a uno o varios juegos de datos remotos 
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cuyo contenido es abundante (no solo en extensión sino también en tipos de datos 
suministrados), ya que permite una gran configurabilidad y deja en manos del 
cliente (esto es, del usuario), la forma de tomar esos datos y mostrarlos. 

Las capacidades de edición también tienen lugar en los SIG Web, ampliando las 
posibilidades que la interactividad más básica ofrece. Un usuario puede añadir su 
propia información a un SIG Web o bien modificar una capa existente empleando 
su navegador. Las tecnologías SIG siguen en este sentido a las tecnologías Web más 
generales, adoptando los conceptos de la Web 2.0 y ampliando las posibilidades 
de los usuarios de colaborar directamente en los contenidos de la red. Por ejemplo, 
OpenStreetMap [82] es un sitio equivalente a la bien conocida Wikipedia, en el cual 
los usuarios pueden añadir sus propias descripciones de elementos geográficos que 
ellos mismos definen. 

A estas mismas tecnologías se les puede dar usos más restringidos sin que 
necesariamente sea dentro de un proyecto colaborativo abierto. Por ejemplo, una 
administración local puede dar acceso a los propietarios de suelo para que puedan 
consultar su catastro, mediante un sistema de autenticación conveniente, incluso 
editar información de sus parcelas. Está información puede ser de tipo no espacial 
(es decir, los límites de las parcelas serían fijos), ya que las capacidades de edición 
no han de limitarse a la componente espacial. 

Por último, y aunque en la actualidad son pocos los servicios de este tipo que 
existen, y no pueden compararse las prestaciones con las que ofrecen los SIG de 
escritorio, la cartografía Web puede ofrecer herramientas de análisis. Además de 
representar un conjunto de datos geográficos y permitir al usuario navegar en ellos 
e incluso editarlos, pueden extraerse resultados a partir de esos datos. 

Un tipo de aplicación bastante extendida de este tipo es el cálculo de rutas ópti- 
mas. A partir de una capa con vías de comunicación un usuario establece un punto de 
salida y otro de destino y la aplicación Web calcula la ruta que optimiza el tiempo em- 
pleado o la distancia total recorrida, según lo explicado en el capítulo 19. [371] es un 
ejemplo de este tipo de aplicaciones en el cual la interfaz no es la de un SIG de escrito- 
rio habitual, sino que se introducen los lugares de origen y destino tecleando sus nom- 
bres y después la ruta calculada se muestra sobre un mapa y también como un con- 
junto de indicaciones a seguir. Es decir, que sobre una base de cálculo SIG se crea una 
aplicación más completa que la que es habitual encontrar en un SIG, aprovechando 
la mayor riqueza de elementos que pueden utilizarse dentro de un navegador Web. 

El término Web Mapping , habitualmente empleado para designar a la cartogra- 
fía Web, se sustituye por Web GIS a medida que las capacidades de las aplicaciones 
Web aumentan, para indicar así que todos los componentes que forman parte de 
un SIG en su sentido clásico, esto es, un SIG de escritorio, se incorporan a dicha 
aplicación Web. 

La figura 23.5 muestra un esquema de la evolución de la cartografía Web a 
través de los tipos anteriormente descritos. 
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Cartografía web colaborativa (adquisición y mantenimiento 
de datos distribuidos) 

Cartografía web analítica (análisis SIG) 

Cartografía web interactiva 

Cartografía web personalizada (representación definida 
por el usuario) 

Cartografía web animada 

Cartografía web distribuida (varias fuentes de datos) 

Cartografía web creada dinámicamente (p. ej, a partir de 
bases de datos) 

Cartografía web estática. 
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Figura 23.5: Evolución de los tipos de cartografía en la Web (según [369]) 


23 . 4 . 1 . Mashups 

Se conoce como mashup o aplicación Web híbrida a una aplicación que basa sus 
contenidos en los de otras páginas Web, integrándolos y creando una nueva página 
que ofrece un servicio distinto. Un mashup accede a los servicios que otras páginas 
proporcionan de forma pública dando un uso distinto a estos en un nuevo contexto. 

Por lo general, la creación de un nuevo mashup resulta sencilla, mucho más que 
lo que sería el desarrollo desde cero de esa misma aplicación. Los mashups suponen 
una extensión de los conceptos de la Web 2.0 al terreno de la programación, ya 
que permiten una participación mayor por parte de los usuarios en los contenidos 
de la propia Web. Si los blogs permiten hoy la publicación de texto sin que sea 
necesario saber crear una página Web, los mashups hacen sencillo aportar a la 
Web contenidos interactivos en forma de nuevas aplicaciones, sin requerir unos 
elevados conocimientos de programación o tecnologías Web a bajo nivel. 

De este modo, los mashups favorecen sobre todo la creatividad, y cuando una 
aplicación Web pone sus servicios a disposición de otros para que los empleen 
en la creación de algún tipo de mashup, ello no va enfocado a programadores 
expertos, sino a cualquiera que sea capaz de tener una idea relevante para utilizar 
esos servicios y sea capaz de ponerla en práctica. Tanto los servicios en sí como los 
datos en los que estos pueden basarse, y que son empleados para la creación de un 
mashup, alcanzan así un público mayor, rompiendo las barreras que anteriormente 
restringían el uso de esas tecnologías a entornos profesionales especializados. 

Los mashups existen en todos los ámbitos de las aplicaciones Web, pero es en 
el ámbito SIG donde han adquirido una mayor importancia y en el que prolife- 
ran en mayor medida. Es por esto que resulta de interés tratarlos con algo más 
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de profundidad, pues el impacto que están teniendo en la popularización de las 
tecnologías SIG es muy elevado. 

Dos son las razones principales por las que los mashups con componente SIG 
son tan populares: 

■ La mayoría de la información que encontramos en la Web puede georrefe- 
r enciarse. Esto hace que una gran parte de los contenidos de una página 
Web puedan complementarse con algún tipo de elemento geográfico, prin- 
cipalmente un visor de cartografía en el que poder mostrar esa información 
georreferenciada con la que se trabaja. 

■ La información geográfica es de difícil acceso, especialmente a gran escala 
y por parte de usuarios o desarrolladores no especializados. Si el interés de 
añadir a cualquier pagina Web algún elemento de tipo SIG resulta claro, 
también es cierto que suelen necesitarse datos adicionales con que acompañar 
a los propios datos de la página. Es decir, si nuestra página Web recoge 
información sobre restaurantes en la zona, mostrar la localización de esos 
restaurantes enriquecerá el contenido, aunque para que esta funcionalidad 
sea verdaderamente útil deberemos contar con algún tipo de mapa base 
(cartografía de calles, fotografía aérea, etc.) que ayude al usuario a emplazar 
un restaurante dado o calcular la forma óptima de llegar hasta él. 

Esta cartografía base implica un coste elevado, normalmente no asumible 
para un uso como este. Sin embargo, disponer de una cartografía base ofrecida 
por un proveedor que permita crear algún tipo de mashup sobre ella facilita 
que existan este tipo de servicios, como así lo atestigua el gran número de 
distintas aplicaciones Web que se desarrollan de este modo. 

De entre los muchos existentes en la actualidad, Google Maps [13] es el servicio 
más popular para la creación de mashups , y el que ha supuesto una verdadera 
revolución en este sentido. Para ver algunos ejemplos relevantes de este tipo de 
sitios Web, puede consultarse la página Web [372], donde se recopila información 
sobre Google Maps y los mashups más exitosos que derivan de este servicio. 


23.5. Clientes y servidores 

Ahora que conocemos algunas ideas generales sobre cartografía Web, veamos 
algo más en detalle los elementos tecnológicos que hacen posible su funcionamiento: 
los servidores y los clientes. Veremos en este apartado las funcionalidades que pre- 
sentan y algo más de los fundamentos tecnológicos en los que se basan, que se apoyan 
sobre las ideas básicas de funcionamiento de Internet que ya vimos anteriormente. 

En primer lugar, veamos algunas ideas básicas sobre la arquitectura cliente- 
servidor. De modo gráfico, la relación entre ambos elementos puede representarse 
según la figura 23.6. En ella, un número variable de clientes se «conectan» a un 
servidor, del cual obtienen una serie de datos cuando este responde a las peticiones 
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formuladas por cada uno de los clientes. En la arquitectura cliente-servidor, este 
último es el que posee la información a compartir a través de los servicios, mientras 
que en cada uno de los clientes se almacena tan solo la información personal de estos. 


Clientes 



Servidor 


Figura 23.6: Relación entre clientes y servidores. 

En el sistema cliente-servidor se presentan las siguientes características prin- 
cipales: 

■ El servidor brinda servicio a múltiples clientes. Los clientes, por su 
parte, también pueden acceder a servicios en varios servidores, aunque esa 
multiplicidad es mucho más relevante en el caso del servidor. Piénsese, por 
ejemplo, en un navegador Web con el que podemos acceder a varias páginas y 
un servidor de una de dichas páginas. Mientras que en el cliente no accedemos 
simultáneamente a un gran número de páginas (si la pagina es estática solo 
usamos el servicio al cargarla, y no cargamos más de una capa en un instante 
dado) , el servidor debe estar preparado para responder a muchas peticiones si- 
multaneas y satisfacer la demanda de muchos clientes en un instante concreto. 

■ Los clientes no dependen de la ubicación física del usuario, el sis- 
tema operativo o la arquitectura física de la máquina. Esto es así porque 
el cliente no necesita conocer la lógica interna del servidor para usar sus 
servicios. Lo único necesario es que el servidor pueda exponer una interfaz 
externa que actúe como un modo de comunicación para recibir las peticiones 
del cliente, siendo esta comunicación siempre transparente para este último. 

■ La carga de proceso se puede repartir entre cliente y servidor. En 
función del servicio y de las capacidades del cliente, el trabajo puede dividirse 
de una u otra forma entre las partes implicadas. 

23.5.1. Servidores 

El servidor es el elemento encargado de ofrecer el servicio como tal, respondien- 
do a las peticiones del cliente. A medida que los clientes se hacen más complejos 




Servidores remotos y clientes. Web Mapping 


611 


y presentan mayor número de funcionalidades, también los servidores deben ser 
capaces de proporcionar servicios más elaborados. Las capacidades fundamentales 
a las que responden los servidores dentro del ámbito SIG pueden dividirse en los 
siguientes grupos: 

■ Servir representaciones de los datos. Los servicios de cartografía Web, 
tanto en sus orígenes como en la actualidad, son eminentemente gráficos, y 
en última instancia lo que la aplicación Web correspondiente va a hacer es 
mostrarnos algún tipo de imagen con un mapa formado a partir de una serie 
de datos geográficos. El servidor puede responder directamente a este tipo de 
necesidades, preparando una imagen a partir de los datos geográficos de los 
que dispone. En el caso de que estos sean ya imágenes - por ejemplo, imáge- 
nes de satélite u ortofotos — , bastará servir estas, transmitiendo una versión 
escalada de las dimensiones exactas que el cliente necesite para representar 
en pantalla. En caso de que los datos sean de tipo vectorial, o bien ráster sin 
una forma de representación implícita — por ejemplo, un Modelo Digital del 
Terreno — es necesario emplear algún método para asignarles dicha represen- 
tación. Este puede ser asignado por defecto por el servidor, que establecerá 
una simbología fija, o bien ofrecer un servicio más complejo en el que el 
cliente no solo pide una representación gráfica de una serie de datos para una 
zona dada, sino que además puede especificar cómo crear esa representación. 
Asimismo, el servidor puede ofrecer la posibilidad de seleccionar los datos 
empleados para crear la representación gráfica. En términos de un SIG de 
escritorio esto es equivalente a seleccionar qué capas se van a representar 
de entre el total de las que se encuentran abiertas o bien en nuestro catálogo 
de datos al que tenemos acceso desde el SIG. En el caso de un servicio Web, 
el servidor dispone de una serie de capas a las que puede acceder, y a la 
hora de servir una imagen puede preparar esta usando unas u otras según 
las necesidades que el cliente especifique a la hora de hacer la petición del 
servicio. De igual modo, el orden en que se desea que las capas se pinten en 
el mapa también debe poder ser especificado por el cliente. 

■ Servir los datos directamente. Una opción más flexible que lo anterior es 
que el servidor provea directamente los datos geográficos y sea después el clien- 
te quien los utilice como corresponda, bien sea simplemente representándolos 
— en cuyo caso debería ser el propio cliente quien establezca la simbología, 
ya que esta tarea ya no queda en manos del servidor — o bien trabajando 
con ellos de cualquier otra forma, como por ejemplo analizándolos. 

Aunque las posibilidades son mayores en este caso, se requieren por parte 
del cliente unas capacidades mayores, ya que mientras que representar una 
imagen es algo sumamente sencillo desde el punto de vista técnico, crear 
esta a partir de los datos geográficos es más complejo. 

■ Servir consultas. Un paso más allá en la funcionalidad que puede ofrecer 
el servidor es responder a preguntas realizadas por el cliente relativas a los 
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datos, ya sean estas relativas a la parte espacial de dichos datos, o bien a su 
componente temática. El servidor puede ofrecer como respuesta conjuntos 
reducidos de los datos de los que dispone, o valores que describan a estos. 
Estas consultas pueden ser útiles, por ejemplo, para establecer filtros previos 
cuando se dispone de un conjunto amplio de orígenes de datos. Un cliente 
Web puede obtener datos de distintos servidores, y puede consultar si, para 
un zona dada, estos servidores disponen de información, sin más que con- 
sultar la extensión cubierta por los datos de cada uno de ellos y comprobar 
si se interseca con la región de interés. En función de la respuesta, puede o 
no realizarse posteriormente el acceso a los datos en sí. Como veremos en 
el capítulo 31, los metadatos son de gran utilidad para conseguir que este 
tipo de consultas se realicen de forma eficiente. 

■ Servir procesos. Por último, un servidor puede ofrecer nuevos datos, 
espaciales o no espaciales, resultantes de algún tipo de proceso o cálculo 
a partir de datos espaciales. En este caso, el proceso constituye en sí el 
servicio ofrecido por el servidor, y el cliente debe definir los parámetros de 
entrada de este y los posibles parámetros de ajuste que resulten necesarios. 
Los datos con los que se trabaja pueden ser proporcionados por el cliente, 
incorporándolos a su propia petición, o bien pueden residir en el propio 
servidor. En este último caso, el servidor ofrece tanto los datos, como la 
posibilidad de extraer resultados a partir de ellos, es decir, los datos y 
una herramienta para explotarlos. También pueden emplearse datos en un 
servidor distinto, a los que el servidor de procesos puede acceder si estos están 
disponibles, convirtiéndose en cliente de ese segundo servidor (Figura 23.7). 
Las posibilidades que estos servicios brindan son muy numerosas. Por una 
parte, pueden añadirse funcionalidades avanzadas a interfaces Web, llevando 
a estas las capacidades propias de los SIG de escritorio. Por otra, la difusión 
de algoritmos de análisis geográfico resulta más sencilla, pudiendo ofrecerse 
estos a todo tipo de usuarios sin necesidad de ningún software especializado. 
Y por último, en ciertos casos pueden rebajarse los tiempos de proceso, ya que, 
en el caso de operaciones complejas, la mayor potencia del servidor respecto 
al cliente puede resultar en un mayor rendimiento. El reparto de tareas entre 
varios servidores (computación distribuida) es otra de las posibilidades que 
pueden a su vez ampliar la eficiencia de los procesos. 


23.5.2. Clientes 

El cliente es el elemento que utiliza los datos proporcionados por el servicio. 
Para ello, realiza una petición a la que el servicio responde enviando dichos datos, 
que serán los que después se emplearán para realizar cualquier otra tarea, prin- 
cipalmente la representación de estos para que el usuario pueda visualizarlos. El 
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Petición de proceso 
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Respuesta de proceso 
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Respuesta de datos 



Figura 23.7: Esquema de acceso a un servicio de procesos remotos, el cual a su vez 
utiliza datos de un segundo servidor. El encadenamiento de procesos permite ampliar 
notablemente la utilidad de estos. 


cliente es, de este modo, el intermediario entre el usuario y los servicios y datos 
que el servidor ofrece. 

Como hemos visto al estudiar los servidores, las principales capacidades de estos 
implican la transmisión de imágenes con cartografía ya elaborada, o bien directa- 
mente capas, ya sean de tipo ráster o vectoriales. En algunos casos, el servicio ofreci- 
do es un servicio de procesos, pero su resultado generalmente es también una capa, 
por lo que, desde el punto de vista del cliente, la funcionalidad es en cierto modo 
similar (aunque internamente requiera una implementación por completo distinta). 

El cliente, por tanto, debe disponer de capacidades para formular peticiones 
a servidores como los anteriormente descritos, así como para emplear las posibles 
respuestas que estos devolverán. Estas últimas incluyen por lo general componen- 
tes de representación, habitualmente con la forma típica de un visor en el que se 
permite cambiar la escala y desplazar la vista, tal y como ya vimos en el capítulo 
22. No obstante, estas capacidades pueden variar ampliamente de un cliente a otro, 
desde el mínimo necesario para simplemente representar los datos obtenidos del 
servidor hasta conjuntos de funcionalidades mucho más avanzadas pensadas para 
un uso intensivo de esos mismos datos. 

Distinguimos así dos tipos de clientes en función de las capacidades que tengan: 
clientes ligeros y clientes pesados. 

■ Cliente ligero. Se denomina ligero por el tamaño relativamente reducido 
del programa en sí, lo cual va consecuentemente asociado a unas capacidades 
limitadas. Hablamos de clientes ligeros cuando nos referimos a Web Mapping 
y a clientes que se ejecutan sobre un navegador Web, los cuales son siempre 
sencillos en cuanto a sus funcionalidades. En el momento de la carga de la 
página Web que contiene al cliente, el navegador descarga toda la lógica del 
programa, lo cual hace necesario limitar el tamaño de este. 

No obstante, los clientes Web empiezan progresivamente a ampliar sus posi- 
bilidades, y en ello juegan un importante papel otros servicios distintos a los 
de mapas o los de datos, como pueden ser los de procesos. Estos permiten 
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que las funcionalidades adicionales no se implementen en el propio cliente (y 
por tanto sin aumentar en exceso su tamaño y sin disminuir su «ligereza»), 
sino que sean accedidas también como servicios remotos. 

La evolución de la cartografía Web en esta dirección se dirige desde el Web 
Mapping al Web GIS, tal y como comentamos algunas páginas atrás. 

■ Cliente pesado. A diferencia del cliente ligero, el cliente pesado es una 
aplicación individual que no se ejecuta sobre otra aplicación soporte como 
puede ser un navegador Web. Al ser un programa independiente, debe 
ocuparse de toda la lógica del proceso y de proveer todas las funcionalidades 
necesarias, por lo que su tamaño es generalmente mayor. Pese a ello, un cliente 
pesado no ha de ser necesariamente más potente y con más funcionalidades 
que uno ligero (aunque habitualmente lo es), ya que existen aplicaciones muy 
sencillas con capacidad para conectarse a servicios de mapas, que ofrecen poco 
más que un visor de cartografía. La diferencia no estriba en las capacidades 
del programa, sino en el enfoque a la hora de implementar este y el uso o no de 
otra aplicación «plataforma», generalmente en forma de un navegador Web. 
Los clientes pesados suelen permitir el uso de datos no procedentes directa- 
mente del acceso a servicios, tales como datos en ficheros locales, y no están 
pensados exclusivamente como clientes, sino como aplicaciones más amplias 
que además disponen de capacidades para aprovechar un determinado tipo 
de servicios. Dicho de otro modo, un cliente pesado tal y como un SIG de 
escritorio tiene utilidad aunque no se emplee como cliente de ningún servicio 
y no se disponga de conexión a red alguna, ya que puede alimentarse con 
datos locales y todas sus restantes funcionalidades (análisis, preparación de 
cartografía, etc.) pueden aprovecharse con dichos datos. 


23.6. Limitaciones y problemas de la cartografía Web 

Trasladar las ideas de los SIG de escritorio a la Web no es sencillo, por cuanto 
el entorno en el que nos movemos es muy distinto en uno y otro caso. La Web tiene 
sus propias limitaciones e inconvenientes, que en muchos casos no existen en el 
caso de una aplicación de escritorio, y este hecho presenta dificultades complejas 
de salvar, obligando a desarrollar soluciones alternativas. 

Una limitación básica es la impuesta por el propio navegador como marco de 
trabajo. Las propias ventajas que este aporta son también responsables de ciertas 
limitaciones, ya que en el desarrollo de una aplicación SIG Web no se tiene la misma 
libertad que al desarrollar una aplicación de escritorio. Este no es un problema 
exclusivo del Web Mapping, sino en general de todas las aplicaciones Web, que, 
pese a los avances que han tenido lugar en este sentido y la rápido evolución de las 
tecnologías Web, siguen sin poder ofrecer exactamente las mismas funcionalidades 
en lo que a interfaces respecta. 
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A lo anterior debemos sumar el hecho de que las tecnologías Web en general son 
recientes y en cierto modo inmaduras, y aunque se emplea gran cantidad de medios y 
esfuerzo en el ámbito Web debido a su vital importancia en la actualidad, una buena 
parte de los elementos tecnológicos sobre los que se fundamenta el Web Mapping 
actual no están todavía completamente desarrollados y necesitan aún evolucionar. 

El aspecto más problemático es, no obstante, la propia red, especialmente en 
lo que respecta a su fiabilidad y rendimiento. Todos los datos que el cliente emplea 
en una aplicación de cartografía Web provienen de la red, y por tanto existe una 
fuerte dependencia entre la aplicación y el funcionamiento tanto de esta como del 
servidor que a través de ella nos proporciona esos datos. 

Si abrimos un archivo con datos espaciales en nuestro ordenador desde un SIG 
de escritorio, podemos casi garantizar que esa misma operación funcionará de 
igual modo si la repetimos en otro momento. Tener esa misma seguridad cuando 
se trabaja con datos remotos no es tan sencillo, ya que la red puede no funcionar o 
el servidor puede estar recibiendo en este momento gran cantidad de peticiones de 
otros clientes y no ser capaz de gestionarlas eficientemente y ofrecernos al instante 
respuesta a nuestra petición. En definitiva, las mismas circunstancias que afectan 
a todas las aplicaciones Web y que son conocidas por todos. 

El rendimiento de la red es más importante aún si cabe en el caso de trabajar 
con información geográfica, ya que los datos suelen ser voluminosos. Visualizar 
un mapa y que este pueda desplazarse y modificarse de forma igual de fluida que 
al trabajar con una aplicación de escritorio requiere por un lado un ancho de 
banda suficiente para transmitir la gran cantidad de datos necesarios, y por otro 
la implementación de algunas técnicas particulares que facilitan este proceso. Por 
su importancia, veremos en detalle las técnicas de tiling (división horizontal de 
los datos geográficos en teselas) y cacheo (almacenamiento temporal de datos en 
la máquina del cliente), utilizadas habitualmente en la actualidad. 

23.6.1. Tiling y cacheo 

Dos técnicas básicas que se emplean actualmente en los clientes Web que ma- 
nejan información geográfica son el tiling y el cacheo. Estas técnicas permiten que 
la experiencia de trabajar con información geográfica dentro de una aplicación SIG 
Web sea más agradable, logrando una mayor fluidez y superando en cierta medida 
las limitaciones de la red. Aunque es cierto que cada vez disfrutamos de mayores 
anchos de banda y velocidades de transmisión más altas, también aumentan de 
igual modo los volúmenes de datos manejados, con lo que las dificultades siguen 
existiendo de manera similar. 

Ambas técnicas se utilizan en servicios en los que el servidor provee imágenes, 
ya que es en estos en los que resultan aplicables, y también donde es más necesario 
recurrir a este tipo de técnicas. 

El tiling es una técnica consistente en dividir las imágenes con las que se trabaja 
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en imágenes menores que formen un mosaico. Esto permite un trabajo más rápido, 
al utilizar unidades mínimas de menor tamaño y poder reducir la necesidad de 
transmitir datos a través de la red si se realiza una gestión correcta del conjunto 
de elementos de ese mosaico. 

Esta división es similar en forma a la propia que se da en los datos originales, 
ya que, como sabemos (véase sección 4.4), estos también se encuentran divididos 
horizontalmente. No obstante, se trata de una estrategia propia del sistema cliente- 
servidor, que divide las propias imágenes que luego se representarán en este último, 
de forma que en lugar de transmitir una única imagen se transmiten varias de 
menor tamaño y la información correspondiente a la posición relativa de estas. 

El cacheo , por su parte, es una técnica no exclusiva del ámbito SIG, sino de 
la Web en general, y consiste en almacenar de forma temporal los datos obtenidos 
de un servidor en la máquina local o bien en una máquina intermedia ( proxy ). De 
este modo, si volviera a resultar necesario acceder a esos datos, no han de pedirse 
al servidor, sino que pueden recuperarse de la copia local, con las ventajas que ello 
tiene en cuanto a la velocidad de acceso y la fiabilidad del proceso. 

El uso conjunto de tiling y cacheo puede disminuir sensiblemente el volumen 
de datos a transmitir para, por ejemplo, modificar el encuadre de un mapa en una 
aplicación SIG Web. La figura 23.8 muestra un ejemplo sencillo que servirá para 
comprender el ahorro de datos que puede conseguirse con el uso conjunto de estas 
técnicas. 
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Teselas descartadas al cambiar encuadre 
Teselas aprovechadas en ambos encuadres 
Teselas adicionales al cambiar encuadre 


Figura 23.8: Esquema del uso de tiling y cacheo para optimizar la transmisión de datos 
en una aplicación SIG Web 

En la figura puede verse del dato global al que se accede, dividido en una serie 
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de unidades. Ello no quiere decir que el dato tenga ese número de divisiones o que 
existan otros tantos ficheros. Puede tratarse de un único fichero, o de un número 
muy elevado de ellos. Las divisiones se realizan a efectos de crear el mosaico de 
imágenes a la hora de transmitir estas. 

Inicialmente, la aplicación Web encuadra una región que cubre 20 elementos 
o teselas. Si el usuario desplaza el encuadre para que cubra otro área distinta, 
como en el caso mostrado en la figura, el cliente realizará una nueva petición 
y obtendrá una nueva imagen, que tendrá exactamente el tamaño con que esa 
imagen va a representarse. Este es exactamente el mismo tamaño que la imagen que 
encontramos inicialmente en el encuadre original, y por tanto la representación de 
este encuadre original y posteriormente el encuadre modificado requiere transmitir 
dos imágenes que cubren cada una de ellas veinte teselas. 

Si, por el contrario, aplicamos conjuntamente las técnicas anteriores de tiling 
y cacheo, al variar el encuadre no es necesario obtener del servidor una imagen que 
cubra todo el área a representar, sino tan solo los 8 elementos correspondientes 
a la zona no cubierta por la imagen inicial, ya que los restantes ya habrán sido 
obtenidos con anterioridad y se encontrarán almacenados ( cacheados ) en nuestro 
ordenador. Es decir, el cliente crea la imagen a representar con 8 subimagenes pe- 
didas al servidor y otras 12 ya descargadas previamente, reduciendo sensiblemente 
el volumen de datos pedidos al servidor. 

Cuando este esquema de funcionamiento se combina con tecnologías como 
AJAX, citada anteriormente, y que añade a su vez mayor fluidez y una mejor 
respuesta de la aplicación Web, el resultado es una aplicación SIG altamente 
funcional y cuyo comportamiento se asemeja en cuanto a rendimiento al de un 
SIG de escritorio trabajando con datos locales. 

Este tipo de técnicas no son exclusivas de los SIG en Internet, sino que también 
se aplican por igual al caso de SIG de escritorio cuando estos actúan como clientes 
y acceden a datos remotos. Particularmente, son de especial relevancia en el caso de 
los globos tridimensionales, en los cuales estas mismas técnicas se aplican no solo 
para las imágenes a visualizar, sino también para los datos de elevación empleados 
para dar forma al relieve. 

La combinación de tiling y cacheo se lleva a cabo a múltiples escalas, de forma 
que se reduce el número de operaciones a realizar y se obtiene un mayor rendimiento. 
Se emplean las denominadas pirámides, que ya vimos en el apartado 3.5.2 dedicado 
a la generalización cartográfica en un SIG. Estas pueden ser empleadas también en 
el lado del servidor, incluso cuando este sirve mapas creados a partir de cartografía 
vectorial. Para evitar tener que rasterizar los datos vectoriales cada vez que se 
realiza una petición (lo cual supondría un gran coste en términos de proceso) , se 
rasterizan de antemano a distintas escalas, de forma que cuando el cliente efectúa 
la petición ya se dispone de una imagen que servirle, sea cual sea la escala que pida.. 

Una técnica de reciente aparición es la denominada emphtiling vectorial. Apli- 
cando los mismos principios que el tiling, es decir, la subdivisión de los datos de 


forma regular, las capas vectoriales se «trocean» en el origen y se envían después so- 
lamente los datos necesarios para el area cubierta en el cliente. Combinando este en- 
foque con el uso de capas con distinto detalle según la escala, se logran dos ventajas: 

■ Disminución del volumen de datos. 

■ Capacidad de modificar la simbología en el cliente. 

Al enviar los datos en lugar de una representación de estos, el cliente es quien 
debe establecer la simbología, lo cual permite que sea el usuario quien seleccione 
cómo representar los elementos vectoriales. Al mismo tiempo, se logran ventajas 
en la experiencia de usuario, debidas principalmente a la escalabilidad de los datos 
vectoriales, que permite por ejemplo presentar transiciones más fluidas cuando 
se modifica la escala del mapa. 

Obviamente, este tipo de enfoque es válido únicamente para el caso de capas 
vectoriales. 

23.7. Resumen 

Hemos visto en este capítulo las ideas fundamentales del binomio cliente- 
servidor, tanto en su definición más general referente a servicios Web de cualquier 
tipo, como en aquellos específicos del ámbito SIG. En base a esto, existen distintas 
formas de llevar a la red tanto los propios datos geográficos como las funciona- 
lidades principales de los SIG de escritorio, y que pueden variar en cuanto a su 
complejidad, desde simples mapas estáticos hasta aplicaciones Web complejas. 
Pese a las elevadas posibilidades que existen hoy en día en cuanto a tecnologías 
Web, es importante conocer también las limitaciones del entorno de trabajo, las 
cuales derivan tanto de la propia red como de otros aspectos, por ejemplo el hecho 
de que la aplicación Web se ejecute dentro de un navegador. Estas limitaciones 
llevan al desarrollo de técnicas particulares para optimizar el funcionamiento de 
las aplicaciones SIG Web, entre las que se han de destacar el tiling y el cacheo. 

Asimismo, conocemos ya las funcionalidades principales que debe presentar un 
servidor para responder a las peticiones de un cliente SIG, que son principalmente 
servir representaciones de los datos geográficos, servir los datos en sí o consultas 
sobre estos, o bien servir procesos de análisis basados en dichos datos. 



Capítulo 24 


SIG móvil 


Los SIG no han sido ajenos a la popularización de las tecnologías móviles y la imparable 
expansión que sufren en la actualidad. Más aún, tratándose de un área relacionada con el 
manejo de información geográfica y el análisis del medio, el aprovechamiento de tecnologías 
que permiten llevar el SIG directamente a ese medio e «interactuar» directamente con 
la información geográfica ha abierto nuevos horizontes dentro del mundo de los SIG. 

En este capítulo veremos las características de una nueva forma de SIG basada en 
su uso sobre dispositivos móviles, y trataremos las nuevas posibilidades que esto ofrece. 
Asimismo, y puesto que los SIG móviles se apoyan en otra serie de tecnologías ( especial- 
mente de comunicación y posicionamiento) , desarrollaremos estas para definir el marco 
tecnológico en el que se encuadra esta rama particular del SIG. 


24.1. Introducción 

A lo largo de la historia de los SIG, han ido surgiendo nuevas tecnologías 
como consecuencia de los cambios que se han producido en los dispositivos sobre 
los que las aplicaciones de manejo de información geográfica pueden ejecutarse. 
La aparición de nuevo hardware es seguida de cerca por los desarrolladores de 
software , que adaptan sus aplicaciones para aprovechar las nuevas características 
de esos dispositivos. Esto, además de impulsar el avance de las aplicaciones SIG 
al permitirles mayor potencia de proceso o mayores capacidades, en ocasiones trae 
consigo la aparición de ramas completamente nuevas cuando la tecnología de los 
dispositivos da un salto cualitativo de grandes proporciones. 

En el veloz avance que el hardware sufre constantemente, uno de los cambios 
más radicales de los últimos tiempos es la cada vez mayor potencia y disponibilidad 
de elementos portátiles. Esto ha propiciado la aparición del denominado SIG móvil, 
así como una serie de tecnologías y herramientas relacionadas que van dando forma 
a un sector muy distinto de lo que el SIG clásico representa, pero con una innegable 
vinculación con este. 

La implicación que estas nuevas tecnologías han tenido en el ámbito del SIG 
va más allá de expandir sus posibilidades. Como vimos en el capítulo dedicado 
a la historia de los SIG, los primeros programa SIG se ejecutaban sobre grandes 
máquinas cuya adquisición estaba muy lejos del alcance del público especializado, 
como sucedía con toda la tecnología informática de aquel entonces. El salto a los 
ordenadores personales fue decisivo para iniciar una popularización de los SIG 
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y contribuir a que se convirtieran en herramientas imprescindibles en una buena 
parte de sus ámbitos de aplicación, entrando con fuerza en muchos sectores. 

Con la aparición de los dispositivos móviles y el crecimiento del mercado en 
torno a ellos, los SIG han dado un nuevo salto cualitativo. No solo han alcanzado 
un nuevo tipo de dispositivos con capacidades muy interesantes relacionadas con la 
información geográfica (destacando entre ellas la capacidad de conocer la posición 
del dispositivo), sino también a un nuevo público y a nuevos grupos de interés. 
Si con el salto a los ordenadores personales los SIG se hicieron más asequibles 
en términos económicos y de especialización informática, con la entrada de los 
dispositivos móviles se han hecho asequibles en lo que a conocimientos específicos 
del ámbito geográfico y cartográfico respecta. La información geográfica se abre 
paso en un mercado no especializado y, no solo su uso, sino también su creación, 
pasan ambos a ser actividades no exclusivas de los profesionales de este campo. Es 
un paso más allá en la labor que desde sus orígenes los SIG vienen realizando, esto 
es, facilitar el uso de información geográfica y dar presencia a esta en todos los 
terrenos, haciendo ver la importancia que tiene en la práctica totalidad de ámbitos. 

Algunas de las tecnologías y utilidades que aparecen con los SIG móviles distan 
mucho de la idea clásica de SIG, y constituyen de por sí un territorio nuevo que 
difiere notablemente de cuanto hemos visto hasta el momento. No obstante, la 
relevancia que estas tecnologías han adquirido y, sobre todo, la que van a adquirir 
en los próximos años, las hace merecedoras de un capítulo propio en este libro y 
de ser consideradas como parte muy importante del panorama actual del SIG. 


24.2. Qué es el SIG móvil 

Comencemos viendo qué entendemos por SIG móvil y de qué formas puede 
presentarse. Para ello, analicemos como hemos hecho en otros apartados una 
situación habitual en el entorno de trabajo de un SIG, en particular la relativa a la 
creación de datos geográficos. Según vimos en el capítulo 6, una de las formas de 
obtener datos con los que trabajar en un SIG es la toma de estos directamente en 
campo y su posterior incorporación dentro del SIG. Esto requería habitualmente 
la digitalización de los datos tomados, ya que dicha toma se desarrollaba en la 
mayor parte de los casos mediante medios analógicos. 

Una importante mejora en este proceso se daría si la recogida de datos se 
efectuara empleando medios digitales, ya que el resultado sería mucho más cercano 
a lo que posteriormente va a necesitarse para el trabajo en gabinete. Además de 
esta ventaja inmediata y del ahorro de tiempo que traería consigo, existen otras 
ventajas directas que los medios digitales aportarían. Por ejemplo, si en lugar 
de un dispositivo de toma de datos contamos con dos de ellos, es relativamente 
sencillo (especialmente si los dispositivos pueden comunicarse entre sí) replicar los 
datos tomados, teniéndose así una copia de seguridad que evitará en gran medida 
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la pérdida de los datos tomados por circunstancias diversas. El software instalado 
en el dispositivo puede a su vez contar con elementos que efectúen algún tipo de 
control de calidad, asegurándose de que no se introducen por descuido valores 
erróneos o de que no se deja sin rellenar ningún campo de un estadillo. 

No obstante, y a pesar de que esa recogida de datos se realiza con el fin de 
tratar estos posteriormente con ayuda de un SIG, el SIG como tal no participa en el 
proceso de toma de datos, sino tan solo en el trabajo de gabinete. Los dispositivos 
que se lleven al campo, sean del tipo que sean, simplemente recogen una serie de 
valores introducidos por el operario correspondiente, del mismo modo que este los 
anotaría en una libreta o estadillo. Sin embargo, nada impide que podamos llevar 
al campo una aplicación SIG (por ejemplo, un SIG de escritorio), y que sea en ese 
SIG, adaptado a esa particular tarea o no, donde tomemos los datos y en el que nos 
apoyemos para realizar todas las tareas adicionales que el trabajo de campo requiere. 

Llevar el SIG al campo y sacarlo de su lugar fijo en el gabinete es lo que da 
lugar al denominado SIG móvil , cuyas particularidades, como veremos, van más 
allá del mero hecho de una localización de trabajo distinta. Cuando hablamos de 
SIG móvil, no nos referimos únicamente a un SIG habitual ejecutándose en una 
plataforma móvil, sino también a una filosofía distinta a la que existe en el uso de 
otros elementos tecnológicos del ámbito SIG que ya conocemos, en una localización 
fija. Es decir, llevar el SIG al campo no conlleva tan solo un cambio físico del 
entorno de trabajo, sino también una notable adaptación en otros aspectos. 

Hoy en día son muchos los dispositivos que podemos emplear para disponer de 
una herramienta móvil con capacidad de proceso. Sin ir más lejos, un ordenador 
portátil con una conexión inalámbrica a Internet (empleando telefonía móvil de 
tercera generación) nos serviría para replicar en campo el entorno de trabajo de un 
SIG de escritorio, poniendo a nuestra disposición todas las capacidades de este. Esta 
solución, no obstante, es poco práctica, ya que, si bien es cierto que podemos «mover» 
un ordenador portátil con relativa facilidad, no es un dispositivo pensado para 
moverse mientras se encuentra en funcionamiento, con lo que más bien tendríamos 
un SIG portátil en lugar de un SIG móvil. Hay otros tipos de hardware mucho más 
adecuados para este cometido, como pueden ser los siguientes (Figura 24.1): 

■ Unidades GPS (a). 

■ Teléfonos móviles (b) . 

■ Tabletas (c). 

Las características de estos dispositivos son distintas a las de un ordenador 
de sobremesa en el que utilizamos el software SIG que hemos visto hasta ahora, 
haciendo que deba desarrollase software específico y que deban tenerse en cuenta 
algunas consideraciones adicionales. A su vez, cada uno de los anteriores dispo- 
sitivos tiene unas capacidades propias que lo hacen más interesante para unas u 
otras tareas dentro del trabajo en campo. 

Así, las tabletas o los teléfonos móviles de tipo smartphone pueden considerarse 
como versiones reducidas de un ordenador de sobremesa o un ordenador portátil, y 
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a) b) c) 

Figura 24.1: Distintos tipos de dispositivos móviles 


aunque en términos de capacidad de almacenamiento y velocidad de proceso están 
por debajo de estos, son dispositivos de gran potencia que en muchos casos pueden 
ejecutar aplicaciones complejas o que requieran la realización de procesos intensos. 

Por su parte, los teléfonos móviles son los dispositivos versátiles por excelencia 
y su penetración es muy superior a la de cualquier otro. 

Las unidades GPS más básicas se limitan a mostrar la localización, disponiendo 
de funcionalidades reducidas. Las más completas, no obstante, incorporan capaci- 
dades más cercanas a las de una tableta o smartphone, con posibilidad de ejecutar 
aplicaciones complejas tales como un SIG adaptado. El interés de la tecnología GPS 
está, sin embargo, en considerarla como una tecnología adicional que enriquece a al- 
gunos de los dispositivos anteriores. Así, tanto teléfonos móviles como las tabletas (o 
incluso otros dispositivos como cámaras fotográficas) pueden incorporar receptores 
GPS y disponen por tanto de información acerca de su posición. Esta combinación 
es la que da como resultado los dispositivos más potentes para el SIG móvil, 
ofreciendo todas las funcionalidades que iremos viendo a lo largo de este apartado. 

Asimismo, la conexión remota a Internet, que a día de hoy presenta un avanzado 
estado de desarrollo, abre la puerta a muchas de las capacidades más potentes 
y novedosas del SIG actual, como pueden ser la consulta o incluso la edición de 
cartografía, según vimos en el capítulo 23. 

Para dar una definición más formal de lo que entendemos por SIG móvil, 
podemos decir que es una tecnología que integra una o más de las siguientes [373]: 

■ Dispositivos móviles. 

■ Sistemas de posicionamiento global (GPS). 

■ Acceso inalámbrico a Internet. 

Por su parte, [374] distingue tres elementos principales que dan forma al 
contexto de las aplicaciones SIG móviles: SIG, Internet, y dispositivos móviles y 
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Nuevas Tecnologías de la Información y la Comunicación (NTIC). La figura 24.2 
esquematiza esto. 



Figura 24.2: Clasificación de aplicaciones del ámbito del SIG móvil en función de las 
tecnologías empleadas (según [374]) 

En el centro, como tecnologías aglutinadoras de las anteriores, encontramos 
los Servicios Basados en Localización (LBS 1 ). En general, se suelen recoger bajo 
esta denominación los servicios que toman en consideración la posición del usuario, 
y en los que se produce la participación de un tercero, el encargado de proveer el 
servicio como parte fundamental de un negocio. Dichos servicios pueden ir desde la 
localización del comercio más próximo hasta el envío de avisos cuando se encuentre 
cerca de otro usuario conocido. 

Podemos, con lo anterior, tener así una primera y muy general clasificación 
de las áreas de aplicación del SIG móvil en los dos siguientes grupos: 

■ SIG «en campo». Se centra más en los trabajos propios del SIG y en la 
recolección y edición de datos. 

■ Servicios Basados en Localización. Servicios ofrecidos por terceros en función 
de la posición del dispositivo y del usuario. 

En los LBS , la persona con el dispositivo es consumidor del servicio, mientras que 
en el SIG en campo su papel es principalmente como operario del SIG, y por tanto 
es esa persona la que provee un servicio o realiza una tarea apoyado en él. Se tiende 
a concebir el LBS como un servicio no especializado cuyo consumidor no ha de estar 
necesariamente formado en las tecnologías SIG, mientras que en el caso del SIG en 
campo sí que debe tener unos conocimientos mínimos, ya que su labor se desempeña 
sobre una aplicación SIG como tal. De los elementos que hemos comentado como 
integrantes del SIG móvil, el LBS da mayor importancia al acceso a Internet y a la 
posición del dispositivo, dejando algo más de lado las capacidades clásicas del SIG. 
El SIG en campo, por su parte, hace énfasis en esas capacidades, complementándolas 
con la movilidad del dispositivo y su capacidad para calcular su posición. 


1 Location-Based Services 
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En nuestro supuesto con el que comenzábamos esta sección, la toma de datos 
para ser posteriormente incorporados en un SIG, nos encontraríamos en un claro 
caso de SIG en campo. Este tipo de enfoques surgieron antes que los LBS, ya que 
las tecnologías necesarias para estos últimos aparecieron con posterioridad. El SIG 
en campo no requiere obligatoriamente una conexión inalámbrica, tecnología de 
muy reciente aparición y, sobre todo, de muy reciente implantación y desarrollo. La 
llegada de esta tecnología, sin embargo, añadió nuevos elementos al SIG móvil, y a 
día de hoy es la cabeza visible de este ámbito, especialmente por la gran expansión 
que ha supuesto para las tecnologías SIG. Como mencionábamos en la introducción 
del capítulo, la popularización del SIG y sus elementos es el verdadero aspecto 
destacable del SIG móvil. 

Pese a lo anterior, la frontera entre estos dos grupos es difusa en cierto modo, ya 
que puede realizarse trabajo de campo aprovechando servicios de terceros a través 
de Internet, y el usuario que aprovecha estos servicios (que pueden a su vez ser muy 
especializados) puede tener amplios conocimientos de SIG y realizar un trabajo 
altamente técnico. En relación con cuanto hemos visto en otras partes del libro, el 
SIG en campo está, a primera vista, más vinculado con todo ello, ya que el perfil 
de su usuario es más similar al del clásico usuario de SIG. La importancia que los 
LBS están teniendo es, no obstante, mucho mayor, ya que alcanza a todo el ámbito 
del SIG y también a grupos de usuarios muy alejados de ese perfil tradicional. 

Independientemente de la naturaleza de la actividad realizada con un SIG 
móvil, está claro que este tiene unas particularidades que lo diferencian del SIG 
como hasta ahora lo hemos conocido, y que son las que, en gran medida, le confieren 
su potencia específica como herramienta para trabajo sobre el terreno. 


24.3. Particularidades del SIG móvil 

Los siguientes son algunos de los principales aspectos a considerar que caracteri- 
zan al SIG móvil y lo diferencian del SIG clásico sobre una plataforma estática [375] : 

■ Variedad de plataformas. Mientras que en en caso de un SIG que se 
ejecuta en un ordenador de sobremesa las diferencias de plataforma son prác- 
ticamente inexistente (con, tal vez, la única salvedad del sistema operativo), 
en el caso del SIG móvil la situación es muy diferente. Existen plataformas 
muy diversas y dispositivos con características completamente distintas (por 
ejemplo, un teléfono móvil es, en ciertos aspectos, radicalmente distinto a un 
Tablet PC). Garantizar que todos estos dispositivos van a poder funcionar 
con una aplicación requiere un esfuerzo extra a la hora de desarrollar esta. 

■ El usuario es parte de la información. El SIG nos permite analizar 
información muy variada, pero los análisis que realizamos se basan en unos 
datos concretos, ya sean estos locales o remotos. La posición de la maquina 
donde se ejecuta el SIG no es relevante ni tenida en cuenta, y ni siquiera existe 
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la posibilidad de conocer y utilizar esta. En el SIG móvil, por el contrario, la 
posición del dispositivo es conocida (si este integra algún tipo de mecanismo 
para calcular está, de entre los que veremos más adelante en esta misma 
sección). Esa posición no solo puede ser empleada como otro dato más, sino 
que, en muchos casos, es el dato más importante y el que permite ofrecer 
servicios personalizados en función de dicha posición. Indirectamente, el 
usuario se convierte también en parte de la información, ya que es su posición 
la que ahora forma parte de esta. 

■ Acceso variable. La calidad del acceso a Internet va a fluctuar notable- 
mente para un mismo conjunto de dispositivo, aplicación, y usuario, ya que 
se trata de un servicio muy variable en función de la localización. 

■ Limitaciones de los dispositivos. Comparados con un ordenador de so- 
bremesa, que representa el dispositivo estándar en el que un SIG se ejecuta 
tradicionalmente, los dispositivos móviles presentan importante limitaciones. 
Las más destacable de ellas es su propio tamaño, ya que las pantallas son 
pequeñas y obligan a un uso distinto de su espacio para poder mostrar en ellas 
todos los elementos necesarios para garantizar una correcta usabilidad de las 
aplicaciones. Otras limitaciones son las ya mencionadas de almacenamiento 
y proceso. Y, por último, deben considerarse también las limitaciones en los 
dispositivos de entrada, muy distintos de los habituales teclado y ratón, y 
sin apenas posibilidad de contar con otros periféricos más específicos. 

■ Escalabilidad de los datos. Por las propias características tanto de los 
dispositivos como de sus conexiones, es necesario poner atención en la esca- 
labilidad de los datos para que las aplicaciones funcionen en circunstancias 
variadas, modificando el detalle en función de las situación. 


24.4. Aplicaciones del SIG móvil 

Para estudiar las posibilidades que el SIG móvil nos brinda, podemos analizar 
el papel que la información geográfica juega en el trabajo de campo. De este modo, 
descubriremos en qué fases de este existirán diferencias si podemos contar con una 
herramienta con las capacidades de un SIG, ampliada además con otros elementos 
tales como un sistema GPS incorporado en el dispositivo. Entendemos aquí trabajo 
de campo no en el sentido tradicional, sino como cualquier actividad desarrollada 
al aire libre en la que pueda aplicarse de algún modo un SIG móvil, y que no 
necesariamente ha de constituir un «trabajo» como tal. 

Por una parte, la información geográfica es una herramienta en la que nos 
apoyamos para desarrollar la actividad en cuestión. Es decir, usamos la información 
geográfica de forma directa. Así sucede, por ejemplo, cuando debemos tomar datos 
en una localización concreta como por ejemplo una parcela de inventario en un 
inventario forestal o un punto de alcantarillado para realizar un control del estado 
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de una red de saneamiento. También hacemos un uso similar cuando buscamos el 
restaurante más próximo o queremos encontrar el camino más rápido para tomar 
una carretera desde nuestro emplazamiento actual. 

Tradicionalmente, la información geográfica se ha llevado al campo en forma de 
mapas impresos. Consultando estos se encontraba el lugar seleccionado y la forma 
de desplazarse hasta él. Empleábamos mapas topográficos para encontrar esa par- 
cela de inventario, callejeros para localizar la alcantarilla o un mapa de carreteras 
para saber cómo desplazarnos en coche. Con el SIG móvil, la información geográfica 
«viaja» al campo en formato digital, almacenada dentro del propio dispositivo o 
bien accediendo mediante este a información remota a través de Internet. Esto ofre- 
ce ventajas tales como una mayor comodidad o como la posibilidad de tener varios 
dispositivos que compartan la cartografía. Es decir, varios técnicos que trabajen en 
campo pueden «llevar» el mismo mapa sin necesidad de tener varias copias de este, 
sino tan solo varias «copias» del dispositivo, que es por otra parte el mismo que em- 
plearán para la toma de datos o para cualquiera de las restantes tareas de su trabajo. 

Por otra parte, la información geográfica en sí puede ser parte de la información 
recogida en campo. Es decir, es objeto de interés directo del trabajo de campo, 
y no solo un medio para realizar este. En este caso, los dispositivos móviles van a 
permitir recoger con más precisión cualquier tipo de dato espacial sobre el terreno, 
al mismo tiempo que facilitan la creación de dicho dato espacial o la edición de 
uno ya existente en función de lo observado. Se unen en este punto la capacidad 
del dispositivo para conocer las coordenadas de su localización y las capacidades 
de las aplicaciones SIG para edición de datos, así como las propias ventajas de los 
datos digitales en lo que a su actualización respecta (véase 6.2). 

Esta es una de las razones principales del auge actual de los proyectos colabora- 
tivos para la creación de cartografía (véase 6.7). Los complejos y caros equipos em- 
pleados en la cartografía clásica pueden sustituirse en muchos casos por dispositivos 
simples como un teléfono móvil o una unidad GPS de consumo, ambos sencillos de 
manejar para el usuario no especializado. Este puede así tomar información geográfi- 
ca y aportarla a algún proyecto comunitario, o bien guardarla para su uso personal. 

Con las ideas anteriores, podemos localizar las principales tareas que el SIG 
móvil va a desarrollar en los distintos ámbitos de aplicación y dividirlas en dos 
bloques: aquellas que permiten a los usuarios optimizar su movilidad durante el 
trabajo de campo, y aquellas que facilitan el desarrollo de la labor en cuestión una 
vez que se ha posicionado correctamente. 

Con respecto a las relacionadas con la movilidad, no se ha de pensar que estas 
se limitan a la localización de un emplazamiento puntual como se ha mencionado 
anteriormente, en lo que sería un uso casi exclusivo del sistema de posicionamiento 
del dispositivo. También el análisis, parte importante de un SIG, puede servir para 
mejorar el desplazamiento que el trabajo en campo conlleva. El cálculo de rutas es 
el principal ejemplo en este sentido, tal y como se implementa en los navegadores 
GPS, aunque no el único. Elaborar un plan de ruta en tiempo real puede ser 
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útil para muchos profesionales, que pueden hacer uso de algoritmos como el del 
«problema del viajante» si estos se encuentran implementados en su SIG móvil. 

Dentro de las actividades que facilitan la labor en campo son de especial 
interés las relacionadas con la captura de información geográfica, que se simplifica 
notablemente como ya hemos dicho. Asimismo, también debemos citar cualquier 
tipo de servicio al que pueda accederse mediante la conexión inalámbrica del 
dispositivo y proporcione información complementaria o algún tipo de apoyo a la 
persona que opera con este. Y por último, no ha de olvidarse el análisis SIG como 
una herramienta con gran utilidad, ya que permitirá realizar procesos adicionales 
que pueden añadir nuevas posibilidades, tales como, por ejemplo, la validación 
en tiempo real de los datos recogidos. 

La siguiente lista resume algunas de las actividades principales que pueden lle- 
varse a cabo con un SIG móvil. Algunas de ellas pueden desarrollarse sin necesidad 
de contar con todos los elementos posibles (dispositivo, conexión inalámbrica y sis- 
tema de posicionamiento) , aunque buena parte requieren el concurso de todos ellos. 

■ Navegación. Cálculo de ruta óptima entre dos puntos, guiado en interiores 
(centros comerciales, museos, etc.), aparcamiento guiado, gestión de tráfico. 
Una de las actividades más populares y extendidas. 

■ Inventario. Recogida de datos de cualquier tipo sobre el terreno. Cubre 
desde datos de inventarios forestales a prospecciones arqueológicas, pasando 
por datos censales o infraestructuras urbanas, entre muchos otros. 

■ Información. Paginas amarillas espaciales o guias de viaje virtuales. En 
general, cualquier servicio de mapas o de puntos de interés con posición (mo- 
numentos, tiendas, aparcamientos...) accesible desde un dispositivo móvil. 

■ Emergencia. Localización de situaciones de emergencia, asistencia a vehícu- 
los, optimización de asistencias y tiempos de respuesta. El usuario, ante una 
emergencia, puede conocer su posición e informar de ella, o bien a través de 
la red puede conocerse esta y emplearse para dar una respuesta óptima y 
una ayuda lo más eficiente posible. 

■ Publicidad. Anuncios basados en localización, indicación de negocios cer- 
canos, promociones para comercios próximos. Existen algunas limitaciones 
para evitar la publicidad no deseada, pero si el usuario da permiso, puede 
recibir información sobre posibilidades comerciales en su entorno. 

■ Seguimiento. Tanto de personas como de productos, a lo largo de rutas 
predefinidas o no. También puede servir para monitorizar una actividad 
en las distintas localizaciones por las que pase el usuario. Por ejemplo, una 
compañía telefónica puede estudiar los patrones de comportamiento en lo 
que al acceso a la red respecta, según el emplazamiento desde el que se accede. 

■ Gestión. Por ejemplo, de infraestructuras, de instalaciones, o de flotas. El 
dispositivo puede ir sobre el elemento a gestionar o bien emplearse para 
llegar hasta él y efectuar allí algún tipo de control. 

■ Ocio. Buscadores de amigos o juegos con componente espacial, entre otros. 
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24.5. Métodos de posicionamiento 

Uno de los elementos clave del SIG móvil es la capacidad de conocer la posi- 
ción del dispositivo en todo momento, incorporando, como ya hemos visto, esa 
posición como un dato más de particular relevancia para realizar otras operaciones 
habituales del SIG o para ofrecer servicios de diversos tipos. Si el dispositivo en 
cuestión es una unidad GPS, está claro que dispone de un sistema para obtener 
su posición, igual que sucede si se trata de otro tipo de dispositivo pero con un 
receptor GPS incorporado. Sin embargo, existen otras formas de que el dispositivo 
conozca su posición, y pueden emplearse de igual modo para obtener resultados 
similares en cuanto a las prestaciones que van a permitir. 

Los métodos mediante los cuales puede determinarse la posición de un dispo- 
sitivo pueden clasificarse en tres tipos, a saber: 

■ Introducción manual de la posición. 

■ Métodos basados en red. 

■ Métodos basados en terminal. 

La introducción manual es el método más obvio y simple que, no obstante, puede 
implicar también el uso de algún tipo de tecnología y requiere algunas matizaciones. 
Además de introducir directamente en el dispositivo las coordenadas actuales de 
este, es posible establecer una posición mediante la denominada geocodificación 
inversa. En el capítulo 6.5.3 veíamos que mediante la geocodificación asignábamos 
coordenadas a un determinado elemento, que podía ser un punto dado o cualquier 
otro elemento susceptible de ser georreferenciada. Aplicando este razonamiento de 
forma inversa, y si disponemos una base de datos con un conjunto de esos elementos 
y sus coordenadas asociadas, podemos obtener estas últimas haciendo búsquedas 
en esa base de datos con el nombre del elemento. Es decir, podemos decirle al 
dispositivo que la posición actual es Badajoz o Estadio Vicente Calderón y él se 
encargará de convertir esa información en una coordenada numérica similar a la que 
se obtendría si tuviera instalado un receptor GPS o alguna otra tecnología similar. 

Algunos servicios de consulta de los que presentábamos en el capítulo 23 permi- 
ten este tipo de operaciones, y devuelven coordenadas asociadas a un determinado 
fenómeno geográfico. En particular, los denominadas servicios de Nomenclátor 
son los encargados de ello, como veremos con más detalle en el apartado 32.6.2. 

Con respecto a los dos tipos restantes, ambos se apoyan en una red de estaciones 
cuyas posiciones son conocidas. Los basados en red obtienen su posición mediante 
cálculos realizados en función de una señal emitida por el dispositivo. El método 
más habitual de esta clase es el empleado por los teléfonos móviles para calcular su 
posición en función del repetidor más cercano de entre los que le ofrecen cobertura. 

Por el contrario, en los métodos basados en terminal es el propio dispositivo el 
que recibe la señal que procede de las estaciones, y en función de estas calcula su 
posición. El sistema GPS es el ejemplo más popular de un método de esta última 
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clase. Existen asimismo métodos combinados que emplean ambas técnicas para 
el cálculo posicional. 

La figura 24.3 esquematiza lo anterior. 




Figura 24.3: Métodos de posicionamiento basados en red (a) y en terminal (b) 

Con independencia del tipo de método, el proceso de cálculo de posición sigue 
un esquema como el siguiente: 

■ La posición de las estaciones es conocida. 

■ La información de la señal se transforma en una distancia (a excepción 
de si se aplica la técnica conocida como Ángulo de Llegada, que veremos 
seguidamente) . 

■ La posición se calcula conociendo las distancias a un número dado de esta- 
ciones base. 

Esto coincide con lo que ya vimos en el apartado 6.6 dedicado al sistema GPS. 

Para convertir la información de la señal en una posición, encontramos diversas 
técnicas, a saber: 

■ Celda de Origen (Cell of Origin, COO). Se identifica la estación base más 
cercana y con ello se sabe que el dispositivo se encuentra en el perímetro de 
esta, dentro de su radio de alcance. La precisión depende de la densidad de 
la red. Para el caso de telefonía móvil, se sitúa entre los 200 metros y varios 
kilómetros, por lo que es baja para cierto tipo de servicios. 

■ Tiempo de Llegada (Time of Arrival, TOA). Se conoce la velocidad de 
transmisión de la señal y el tiempo entre el envió y la recepción de la señal, 
con lo que puede calcularse la distancia. Se tiene así la distancia respecto 
a una estación dada. Considerando la velocidad de transmisión de la señal, 
son necesarios relojes de alta precisión para lograr un calculo preciso. 

■ Diferencia de Tiempo de Llegada (Time Difference of Arrival, TDOA) o 
Diferencia de Tiempo Observada Mejorada (Enhanced Observed Time Dif- 
ference, E-OTD). En ambas técnicas se mide igualmente el tiempo, pero el 
cálculo de la distancia se basa en la diferencia de las señales de tres estaciones, 
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pudiéndose así triangular la posición. En el caso de TDOA el cálculo de la 
posición lo realiza el proveedor de la red, mientras que en el E-ODT es el 
dispositivo móvil quien lo hace. 

■ Ángulo de Llegada (Angle of arrival, AOA), Dirección de Llegada (DOA): 
Se usan antenas direccionables para detectar el ángulo de llegada. 

Estas técnicas pueden emplearse simultáneamente, con objeto de proporcionar 
una localización más fiable o de adaptarse a las propias circunstancias de la red 
de estaciones en cada momento. 

Es interesante mencionar que la precisión en los métodos basados en terminal 
es en general mayor que la de los métodos basados en red, siendo así más adecuados 
para servicios en los que la posición deba conocerse de forma más precisa [376]. 
Así, el GPS ofrece precisiones mucho mayores que las que se pueden obtener con 
la identificación de la celda más cercana en una red de telefonía móvil. El GPS es, 
sin embargo, una técnica pensada para emplearse en exteriores, y los servicios en 
interior no pueden hacer uso de este, además de requerir una precisión aún mayor. 
En este caso, métodos basados en redes locales inalámbricas (WLAN), Bluetooth 
o ultrasonidos son una opción válida, todos ellos también basados en terminal. 


24.6. Redes inalámbricas 

Uno de los elementos más importantes en el SIG móvil es la conexión inalámbri- 
ca, que nos permite el acceso a Internet y poder acceder a todos los tipos de servicios 
a través de esta. Sin conexión, disponemos de gran cantidad de funcionalidades, 
en especial aquellas fundamentales para lo que denominábamos SIG en campo. 
Podemos llevar el SIG móvil y tomar datos, realizar análisis geográficos sobre el 
terreno o navegar hasta una posición dada. Para ello solo necesitamos los datos 
que estén almacenados en el propio dispositivo, tal y como sucede en un navegador 
GPS que contiene su propia cartografía. 

Sin conexión a Internet, sin embargo, no se dispone de capacidad para recibir 
servicios ni tampoco para acceder a datos remotos o realizar consultas sobre datos 
de terceros, limitando así de forma notable el alcance del SIG móvil. Siendo la 
conexión inalámbrica un elemento tan relevante, es necesario conocer algunos 
fundamentos acerca de su funcionamiento y de cómo los dispositivos habituales 
en el SIG móvil incorporan la tecnología correspondiente. 

Existen dos esquemas principales para clasificar las redes inalámbricas: según 
la topología de la red y según su alcance 

En relación con la topología de la red encontramos dos grupos: aquellas en 
que la red presenta una infraestructura formada por un número de estaciones 
inmóviles (nodos) a las que acceden los terminales, y aquellas en las que los propios 
terminales forman una red ad-hoc, siendo ellos mismos los nodos de esta. 

Según su alcance, y variando este de menor a mayor, podemos dividir las 
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redes inalámbricas en Redes Inalámbricas de Área Personal (Wireless Personal 
Area Network, WPAN), Redes Inalámbricas de Área Local (Wireless Local Area 
Network, WLAN) y Redes Inalámbricas de Área Amplia (Wireless Wide Area 
Network, WWAN). Está clasificación se emplea con frecuencia, por lo que veremos 
los tipos anteriores con algo más de detalle. 

Una red WPAN tiene un alcance corto, de unos 10 metros, y utiliza una fre- 
cuencia que no requiere de licencia para operar. La mayoría de las redes de este 
tipo se basan en Bluetooth, y su velocidad de transmisión es de unos 0.5 Mbps. 

Por su parte, una red WLAN tiene un alcance mayor, entre 10 y 100 metros, 
y su velocidad es muy superior, hasta los 100 Mbps. Utilizan también frecuencias 
sin necesidad de licencia. Las redes inalámbricas de este tipo surgen a partir de las 
redes locales no inalámbricas (LAN), principales pensadas para la transmisión de 
datos. Es por ello que esta tecnología esta principalmente orientada a la transmisión 
de datos, y no ofrece soporte para voz como sucede con las redes WWAN. 

Una red WWAN cubre un a distancia de entre 100 metros y 30 kilómetros, y 
emplea una frecuencia no libre, es decir, una cuyo uso requiere la adquisición de 
una licencia. Originalmente este tipo de redes se pensaron para transmisión de 
voz, por lo que su velocidad es baja, 4,8 kbps. La evolución de estas redes para 
la transmisión de datos ha dado lugar a una segunda generación con mayores 
velocidades, como sucede con las redes de los sistemas GSM (Global System for 
Mobile) o GRPS (General Packet Radio Service), con velocidades de 9,6-14 kbps 
y 20-115 kbps respectivamente. Estas velocidades siguen siendo insuficientes para 
gran cantidad de aplicaciones, pero las redes de tercera generación, como el sistema 
UTMS (Universal Mobile Teleconrmunication System) europeo, pueden alcanzar 
tasas que permiten operar fluidamente del mismo modo que en una red local. 


24.7. El sofware SIG móvil 

Conocemos ya los elementos que integran el SIG móvil y las tecnologías im- 
plicadas tales como las redes inalámbricas y los métodos de posicionamiento. Es el 
momento de ver cómo el software SIG se adapta a estas circunstancias y cuáles son 
las características de las aplicaciones que vamos a encontrar sobre los dispositivos 
móviles. 

Las diferencias entre los SIG de escritorio y los SIG sobre dispositivos móviles 
vienen motivadas fundamentalmente por dos razones: las capacidades limitadas 
de estos (que mencionamos al inicio del capítulo) y las funcionalidades extras que 
presentan (principalmente la capacidad de posicionamiento). De igual modo, el 
enfoque y el tipo de uso que se pretenda dar condicionan la forma de las aplicaciones, 
existiendo una gran diferencia entre las aplicaciones dirigidas a lo que denominá- 
bamos SIG en campo y aquellas orientadas a los servicios basados en localización. 

Comenzando con las primeras, representan el software más similar a los SIG de 
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escritorio, ya que las funcionalidades que resultan de interés son en buena medida 
aquellas que encontramos en estos. La lectura de datos y su representación son 
de nuevo los pilares fundamentales entre las capacidades que una aplicación para 
SIG en campo debe presentar, aunque tanto la edición como el análisis cobran 
relevancia y se implementan habitualmente para usos particulares. A su vez, tanto 
la lectura como la representación de datos son dos de las áreas en las que es más 
necesaria una adaptación debido a las limitaciones del dispositivo. 

En el caso de la lectura de datos, la limitada capacidad de almacenamiento 
y, sobre todo, memoria y velocidad de proceso, plantean un problema a la hora 
de desarrollar un software que se comporte de manera similar a un SIG de escri- 
torio. Aunque el desarrollo de ciertos tipos de dispositivos móviles es rápido y sus 
capacidades casi alcanzan en algunos casos a las de un ordenador de sobremesa, 
el manejo de datos voluminosos sigue estando restringido. Este tipo de datos, no 
obstante, no son necesarios con tanta frecuencia como en el trabajo clásico con un 
SIG de sobremesa y, dado que otro tipo de funcionalidades están más limitadas, 
el rango de actividades que se van a desarrollar con tales datos es más reducido, 
lo que simplifica el desarrollo de todo lo relativo a su acceso y manejo. 

Aunque un SIG móvil era en su concepción inicial un elemento autónomo capaz 
de contener los datos necesarios para su funcionamiento e incluso incorporar nuevos 
datos mediante la creación in situ de estos, la aparición de las redes inalámbricas 
ha cambiado esta tendencia y ahora el desarrollo se enfoca hacia el consumo de 
datos externos a través de la red. Este planteamiento soluciona las dificultades que 
existen para la lectura de datos de gran volumen, ya que el dispositivo se convierte 
en un cliente y delega las tareas más costosas al servidor correspondiente. 

En los dispositivos de mayor potencia, adecuados para un desarrollo profesional 
del SIG en campo y para la recogida de datos, el SIG conserva sus capacidades 
de acceder a datos locales, mientras que en otros menos potentes y especializados, 
tales como teléfonos móviles, se consumen exclusivamente datos remotos. Algunas 
aplicaciones con base SIG, tales como navegadores, pueden utilizar cartografía 
digital almacenada en el dispositivo, pero la aplicación como tal no permite la 
utilización de otros datos distintos o la lectura de diversos formatos, como sí sucede 
en un SIG de escritorio. 

En lo referente a la representación, la principal diferencia que se ha de considerar 
a la hora de diseñar un SIG móvil es, como parece lógico, la reducida dimensión de 
las pantallas. Especialmente a la hora de visualizar datos y aplicar una simbología 
a estos, se ha de tener en cuenta que existe una limitación de tamaño y que no 
pueden aplicarse ideas idénticas a las que serían adecuadas para una pantalla de 
ordenador común, ya que, al trasladarlas a la del dispositivo móvil, puede obtenerse 
como resultado un mapa carente de utilidad que no transmite adecuadamente la 
información geográfica que contiene. Los conceptos de generalización cartográfica 
que mencionamos en el apartado 3.5 (por ejemplo, la exageración de elementos) 
han de tenerse muy presentes en la creación de un SIG móvil. 
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No solo en la forma de representación existen diferencias, sino también en las 
propias funcionalidades de visualización incorporadas en la aplicación. Esto está 
relacionado no únicamente con las limitaciones de la aplicación — podemos decir 
que, en general, el SIG sobre un dispositivo móvil es una versión más simplificada y 
menos compleja de un SIG de escritorio — , sino con las necesidades que el usuario 
va a tener en este aspecto. 

Por ejemplo, podemos asumir que un usuario de un SIG móvil va a requerir 
menos capacidades para establecer una representación particular de los datos 
espaciales, ya que el trabajo que realiza es menos exigente en ese sentido. Mientras 
que sobre un SIG de escritorio se elabora cartografía y se trabaja con múltiples 
capas y en contextos de trabajo muy distintos, un usuario de un SIG móvil emplea 
la representación visual de los datos como forma de navegación (de modo similar 
a como emplearía un mapa en papel) , o como un apoyo para la edición o toma 
de datos. En el primer caso, en la representación debe primar la claridad, para 
facilitar la localización de aquello que busca. Aspectos relativos al análisis visual 
de la componente temática del dato geográfico no son relevantes, ya que es raro 
que el usuario efectúe ese tipo de operaciones. En el segundo caso, debe prevalecer 
la representación clara de aquello que se edita o de los elementos principales del 
entorno que van a servir de guía para la edición o creación de nuevos datos. 

Aunque también los SIG móviles tienen parte del carácter generalista de los 
SIG de escritorio, su contexto está más acotado o, al menos, más limitado en cuanto 
a la extensión de las actividades que pueden llevarse a cabo y las necesidades que 
van a plantear. Por esta razón, sus funcionalidades, con la visualización en lugar 
predominante, también se encuentran limitadas. 

Gracias al acceso a Internet que se mencionó anteriormente, no solo las tareas de 
acceso y procesado de datos se delegan en un servidor, sino también las relacionadas 
con la representación. Por eso, es más habitual que los SIG móviles actúen como 
clientes de servicios de mapas (es decir, de representaciones ya hechas y listas para 
visualizarse, como vimos en el apartado 23.5.1), y no como clientes de servicios 
más complejos en los cuales se obtienen los datos y después es la aplicación la que 
se encarga de formar la representación a partir de ellos. 

Esto no quiere decir que este tipo de capacidades no se encuentren en los 
SIG móviles. De hecho, algunas aplicaciones SIG móviles permiten incluso que 
la edición de la cartografía sea también un servicio remoto, es decir, que cuando el 
usuario edite o añada nuevos elementos en su trabajo de campo, estos cambios no 
tengan lugar en los datos locales que existen en el dispositivo, sino que modifica los 
presentes en un repositorio remoto. Esta funcionalidad, poco frecuente incluso en 
los SIG de escritorio más completos, aparece en algunos SIG móviles. No obstante, 
las posibilidades de representación son menores en el SIG móvil, entendiéndose 
que no es necesario ofrecer capacidades avanzadas de este tipo. 

A modo de ejemplo, y tras lo explicado hasta este punto, se muestra en la 
figura 24.4 el aspecto de una aplicación SIG móvil. 
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Figura 24.4: Aspecto de una aplicación SIG móvil (gvSIG Mobile) 


En los servicios basados en localización, todo lo anterior tiene lugar de un modo 
aún más patente, reduciéndose por lo general más aún las funcionalidades. El 
usuario tiene menos capacidad para «operar» con el dispositivo y con el software, y 
los servicios se diseñan para que sean sencillos de consumir. Los teléfonos móviles, 
que representan el dispositivo por excelencia para este tipo de aplicaciones, tienen 
capacidades más reducidas que otros de los adecuados para el SIG móvil, por 
lo que esta limitación de funcionalidades es también producto del dispositivo al 
que están orientadas mayoritariamente. La menor especialización de los usuarios 
influye también en que las aplicaciones presenten esas características. 


La imagen 24.5 muestra dos ejemplos de aplicaciones para servicios basados 
en localización. Adviértase que estas no tienen necesariamente que guardar si- 
militud con la idea clásica de un SIG, y que pueden no incluir ningún tipo de 
representación cartográfica. Es decir, que pueden proveer el servicio dando algún 
tipo de información geográfica (en el caso del ejemplo de la izquierda, se ofrecen 
mensajes de otros usuarios del servicio localizados en la misma zona) sin necesidad 
de mostrarla sobre un mapa. En el caso de la captura de pantalla mostrada en 
el lado derecho, la información sí aparece en un mapa, en el cual se muestran los 
contactos del usuario que se encuentran cercanos. El servicio en este caso es una 
forma particular de agenda de contactos que hace énfasis en algunos de ellos en 
función de su localización y la del usuario. 
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Figura 24.5: Dos servicios basados en localización sobre un teléfono móvil. En la parte 
izquierda, Foursquare [http://www.foursquare.com]. En la parte derecha, Life360 
[http: //www. Iife360 . com]. 


24.7.1. El contexto 

Un hecho básico a considerar a la hora de diseñar software para un SIG móvil 
es que en este el software conoce dónde se encuentra el usuario, y el trabajo de 
dicho usuario normalmente se basa en emplear esa localización para realizar algún 
tipo de tarea. Aparece así un concepto que carece prácticamente de importancia 
en un SIG de escritorio que se ejecuta sobre una máquina inmóvil, pero que en 
el SIG móvil y en cualquier otra aplicación móvil resulta fundamental: el contexto. 

Entendemos por contexto toda aquella información que puede ser utilizada 
para caracterizar la situación de una entidad. Una entidad es una persona, lugar o 
objeto que se considera relevante para la interacción entre el usuario y la aplicación, 
pudiendo considerarse como entidad también a estos últimos [377]. 

Los factores implicados en definir un contexto son variados, pero pueden 
considerarse divididos en cuatro grupos fundamentales [378]: 

■ Contexto espacial. Caracterizado por dónde se encuentra el usuario. 

■ Contexto social. Caracterizado por quién es el usuario. 

■ Contexto informacional. Caracterizado por qué recursos se hallan cerca 
del usuario. 

■ Contexto técnico. Caracterizado por las características de la red y los 
dispositivos. 

Si atendemos al caso particular de los servicios basados en mapas, [379] propone 
los tipos de contexto que se detallan a continuación: 

■ Usuario. La identidad del usuario permite considerar aspectos tales como 
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su edad y sexo (las cuales condicionan inevitablemente sus intereses) , sus 
preferencias personales (por ejemplo, el idioma que habla y en el que quiere 
recibir el servicio) o quienes son su amistades y desea contactar con ellas. 

■ Localización. El elemento de contexto más empleado, puede ser tanto 
absoluta (expresada mediante una coordenada georeferenciada) o relativa 
a algún otro elemento que forma a su vez parte del contexto. 

■ Tiempo. Puede considerarse a distintas escalas. Por ejemplo, la hora del día 
(de interés si se busca un establecimiento para indicar al usuario solo aquellos 
que estén abiertos en ese momento) o la estación del año (que condiciona las 
actividades que se pueden realizar, ya que muchas de ellas son estacionales). 

■ Orientación. Para saber hacia dónde se dirige el usuario y conocer, por 
ejemplo, qué tiene delante a la vista. También para servicios de navegación, 
para saber si el usuario sigue adecuadamente una ruta propuesta. Si el 
usuario se mueve, puede conocerse mediante el movimiento, pero en caso de 
estar parado requiere la presencia de elementos adicionales en el dispositivo. 

■ Historial de navegación. Permite crear un perfil del usuario y saber sus 
intereses en función de los lugares en los que ha estado. 

■ Propósito de uso. Viene definido por las actividades y objetivos del usuario, 
así como el papel que ejerce durante la utilización del dispositivo móvil. Los 
distintos tipos de usuarios tendrán diferentes necesidades en lo que respecta 
a la información, la presentación (por ejemplo, mapas con una representación 
más o menos técnica) o los modos de interacción con el dispositivo. 

■ Situación cultural y social. La situación de un usuario en este sentido se 
caracteriza por la proximidad a otros usuarios, su relación social y sus tareas 
colaborativas. 

■ Entorno físico. En este apartado se incluyen elementos como la ilumina- 
ción existente o el ruido ambiente, que condicionan la interacción con el 
dispositivo y las capacidades del usuario de operar sobre él. 

■ Propiedades del sistema. Se incluyen aquí los aspectos relativos a la 
tecnología. Por ejemplo, si el dispositivo es en color o en blanco y negro, si tiene 
teclado o pantalla táctil, o si la conexión a Internet es continua o intermitente. 

Algunos de los anteriores puntos puede pensarse que no guardan una relación 
directa con los LBS y no han de ser exclusivos de estos. Es decir, que elementos 
como, por ejemplo, el tiempo, pueden ser tenidos en cuenta a la hora de proveer un 
servicio sin necesidad de que el dispositivo a través del que se realiza dicho servicio 
cuente con medios para establecer su posición. Un ordenador de sobremesa, por 
ejemplo, también dispone de información sobre el tiempo que puede considerarse. 
Aunque esto es cierto, la inclusión del contexto espacial añade relevancia a los 
otros elementos del contexto, ya que modifica en gran medida la labor del usuario 
y la naturaleza de su actividad sobre el dispositivo. 

Si recurrimos al clásico ejemplo del cálculo de rutas, aunque el análisis llevado a 
cabo sea similar y requiera unos datos similares (punto de inicio, punto de destino y 
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red de vías de comunicación) , el hecho de que unos de dicho puntos (habitualmente 
el de salida) sea la coordenada actual del dispositivo modifica en gran medida 
muchos aspectos de esa operación. Al realizar un cálculo de rutas en un SIG de 
escritorio sobre un ordenador de sobremesa, lo normal es que este cálculo nos sirva 
para planificar un viaje futuro o para estimar el tiempo que, en algún momento 
dado, tardaremos en cubrir la distancia entre dos puntos. 

Al contrario que en el caso de usar un dispositivo móvil como un navegador 
GPS, ese viaje por esa ruta no vamos a realizarlo inmediatamente, no tiene necesa- 
riamente que ser un trayecto cercano a nuestra posición actual e incluso no vamos 
a ser nosotros mismos quienes hagamos el recorrido. De este modo, el contexto 
temporal o el personal del usuario no tienen significado alguno. Podemos incluir 
esas variables explícitamente si el software así nos lo permite, pero no son una 
parte inherente al cálculo y que siempre sea tenida en cuenta. Por su parte, en 
un dispositivo móvil pueden incorporarse todos estos factores asumiendo que, en 
la mayoría de los casos, sí van a ser de importancia. En resumen, que el hecho de 
que se trabaje sobre un dispositivo móvil y este permita conocer su posición añade 
significado a todas las clases de contexto. 



Figura 24.6: Dos ejemplos de realidad aumentada (cortesía de 5 Magazine) 

El software debe diseñarse de forma que pueda responder a ese contexto y 
adaptarse a él. Las siguientes son las áreas principales en las que esa adaptación 
puede producirse [380] : 

■ Información. La información proporcionada a un usuario varía en función 
del contexto en que se encuentre. Por ejemplo una búsqueda de un deter- 
minado tipo de comercio puede restringirse a un radio de alcance desde su 
posición habitual, o bien filtrarse para informar solo de aquellos que ofrezcan 
algún producto o servicio que sea de interés para el usuario. 

■ Tecnología. Conociendo las características del dispositivo, puede estable- 
cerse la mejor forma de ofrecer un servicio. Si, por ejemplo, la pantalla del 
dispositivo es demasiado reducida, no será interesante hacerlo mediante 





imágenes de gran tamaño, así cómo proveer algún tipo de información sonora 
si el dispositivo no dispone de capacidades para reproducir sonido. Como ya 
vimos, una de las características del SIG móvil es la variedad de plataformas, 
por lo que la adaptación en este sentido es importante para poder satisfacer 
las necesidades de los usuarios con independencia de qué plataforma emplean. 

■ Interfaz de usuario. El servicio puede alterar la interfaz sobre la que opera 
el usuario. El ejemplo más clásico es el desplazamiento de un mapa a medida 
que este se mueve. 

■ Presentación. Si la información requiere ser representada, esto puede ha- 
cerse de diversas formas en función del contexto. La simbología empleada 
se adapta, por ejemplo, a las preferencias del usuario (resaltando aquellos 
elementos que le resultan de mayor interés) o a la hora del día (señalando 
de algún modo explícito el hecho de que algunos elementos pueden no estar 
disponibles, tales como comercios si es de madrugada), entre otros factores. 

La adaptación a un contexto dado puede ser mayor o menor en función de las 
propias características del servicio y de cómo este se plantee. En algunos casos 
puede llegar a ser muy intensa, tal y como sucede en la denominada realidad 
aumentada, donde la frontera entre la realidad y el dispositivo se difumina gracias a 
que aquella se «sumerge» en este y es ampliada. En la realidad aumentada, vemos en 
la pantalla de nuestro dispositivo imágenes del entorno en el que nos encontramos, 
pero complementadas con elementos adicionales tales como gráficos, vídeos o sonido. 
Estos elementos es posible incorporarlos gracias a que se conoce con exactitud el 
contexto, y esa información puede emplearse para buscar nueva información que 
añadir. La figura 24.6 muestra sendos ejemplos muy ilustrativos de lo anterior. 

24.8. Resumen 

Los SIG móviles combinan las tecnologías SIG con los dispositivos móviles, el 
acceso inalámbrico a Internet y los sistemas de posicionamiento, para ofrecer una 
solución ventajosa para el desarrollo de trabajo de campo. De particular interés 
son los denominados Servicios Basados en Localización, donde un tercero ofrece 
servicios que dependen de la posición en cada momento del dispositivo. Otras de 
las tareas fundamentales del SIG móvil son la navegación o la captura de datos 
espaciales directamente en el dispositivo, las cuales son las principales en lo que 
hemos denominado SIG «en campo». 

Para comprender el funcionamiento de las tecnologías implicadas en el SIG 
móvil, hemos analizando por separado los métodos de posicionamiento, las redes 
inalámbricas y las aplicaciones de software, cada una de las cuales desempeña un 
papel básico en definir las capacidades de un sistema SIG móvil. 


Parte V 

La visualización 




Capítulo 25 


Introducción. Los SIG como herramientas de visualiza- 
ción 


La representación de la información geográfica es una parte fundamental en el trabajo 
con SIG, y habitualmente durante una sesión de trabajo aparece la necesidad de crear 
algún tipo de representación visual. Antes de entrar en los siguiente capítulos de esta parte 
y detallar los conceptos de representación que después emplearemos para visualizar la 
información geográfica, veremos en este lo que esta representación implica dentro de un 
SIG. Estudiaremos los SIG como herramientas que permiten visualizar la información 
geográfica, analizando sus puntos débiles y sus aspectos más destacados, y veremos cómo 
están concebidos de cara a satisfacer las diversas necesidades que aparecen en este terreno. 

Puesto que vamos a tratar las capacidades de los SIG para la visualización, con especial 
atención a las de los SIG de escritorio, los conceptos del capítulo 22 dedicado a éstos 
deben conocerse con detalle. También es interesante recordar las ideas sobre Web mapping 
descritas en el capítulo 23. 


25.1. Introducción 

Visualizar la información geográfica es una parte fundamental del trabajo con 
un SIG. Aunque no es un aspecto imprescindible, y es posible incluso encontrar 
SIG enfocados al análisis en los cuales no existe forma de visualizar la información 
con la que se trabaja, la gran mayoría de soluciones, especialmente las de escritorio, 
incluyen las funcionalidades de visualización como elemento básico, y estas resultan 
imprescindibles para la inmensa mayoría de usuarios. 

Como ya vimos en el capítulo dedicado a las herramientas de escritorio, dos 
son las tareas que un SIG debe permitir en lo que a visualización respecta: crear 
representaciones dentro del entorno mismo del SIG y generar representaciones 
autocontenidas que puedan imprimirse y den lugar a un documento cartográfico 
en sentido clásico. La representación en pantalla dentro del SIG puede guardar 
similitud con la idea clásica de mapa, o bien ser distinta, aprovechando elementos 
que no son habituales en esos mapas y que la tecnología del SIG sí que permite. 

En ambos casos, no obstante, lo más relevante de cara a los conocimientos que el 
usuario del SIG debe tener en cuanto a visualización es la capacidad de convertir los 
datos en elementos visuales, con independencia de que estos vayan a representarse y 
usarse en pantalla durante una sesión de trabajo, o bien vayan a imprimirse en papel 
para su uso posterior en ese soporte. Este es el objetivo de esta parte del libro: propor- 


642 


Sistemas de Información Geográfica 


donar las ideas fundamentales para que el usuario de SIG logre las mejores represen- 
taciones visuales durante su trabajo con el SIG. Para ello, lo primero es conocer qué 
nos ofrece un SIG como herramienta de visualización y qué podemos esperar de él. 


25.2. Particularidades del SIG como herramienta de 
visualización 

Como herramienta de visualización, el SIG tiene sus particularidades, las cuales 
deben unirse a las propias de los modelos de almacenamiento que empleamos para 
recoger la información geográfica a visualizar. Esto hace que el trabajo de generar 
una representación visual de una determinada información geográfica no sea igual 
en el caso de realizarse mediante un SIG que cuando se lleva a cabo en base a la 
labor clásica del cartógrafo. Trabajar en un SIG añade, entre otros elementos, el 
hecho de que la información se encuentra almacenada según un modelo dado (ráster 
o vectorial). Si esta distinción implica, como ya sabemos, notables diferencias a la 
hora de analizar esa información u optimizar el acceso a los datos que la contienen, 
no es menos cierto que también va a conllevar un enfoque distinto a la hora de 
visualizar unos u otros tipo de datos. 

Para el cartógrafo en su concepto clásico, esta distinción no existe. Indirecta- 
mente, sí puede asumirse que existe algo similar, ya que el cartógrafo ha de conocer 
la naturaleza de las variables que representa, y sabemos que esta naturaleza se 
encuentra muy ligada al modelo a escoger para representarla (por ejemplo, sabemos 
que variables continuas como la elevación se analizan mejor si se almacenan según 
el modelo ráster, aunque ello no implica que no puedan almacenarse de un modo 
distinto y ello no tenga interés) . No obstante, no existe una división formal explícita 
tal como sucede en el caso del SIG. 

Otra de las diferencias a la hora de representar la información geográfica en 
un SIG deriva del propio objetivo que dicha representación tiene. La labor del 
cartógrafo tiene como fin primordial el crear un elemento visual que transmita 
la información geográfica. El cartógrafo, por lo general, no es un usuario de la 
cartografía, sino un productor de esta para su uso por terceros. El usuario de SIG, 
sin embargo, puede crear cartografía para otros pero, en la mayoría de los casos, 
la crea para sí mismo para poder emplearla como una herramienta más a la hora 
de desarrollar su trabajo con el SIG. Por esta razón, la representación visual que 
se produce con un SIG puede tener un carácter general y estar pensada para ser 
empleada en ámbitos diversos, pero también puede tener una funcionalidad muy 
clara dentro de un campo de aplicación dado, o incluso dentro exclusivamente de 
un proyecto concreto. Este hecho puede relajar las exigencias que se presentan al 
generar una representación cartográfica en un SIG, pero al mismo tiempo también 
ofrece la posibilidad de enfocar el esfuerzo de visualización de forma más particular. 
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Es decir, de considerar el contexto de ese ámbito de utilización para lograr una 
representación más eficaz dentro de ese entorno particular. 

Por último, cuando pensamos en un mapa tradicional es difícil advertir que 
se trata de un elemento visual creado a partir de otro no visual. Es decir, un mapa 
es un elemento gráfico desarrollado a partir de unos ciertos datos. Los datos en 
sí no pueden «verse», pero son los que posibilitan la creación del mapa. Resulta 
más sencillo pensar que el cartógrafo simplemente plasma la realidad del terreno 
(que podemos ver con nuestros propios ojos sin más que ir a la zona representada 
por el mapa) , que pensar que está convirtiendo datos en elementos gráficos tales 
como líneas o puntos. Sin embargo, y aunque no utilicemos un SIG, esos datos 
existen, ya que el cartógrafo pone sobre el papel las medidas (datos numéricos) 
tomados por los técnicos en campo, ya sean estas provenientes de algún sensor o 
el resultado de un levantamiento topográfico, entre otros orígenes posibles. 

El beneficiario de esos datos es el usuario del mapa, que recibe la representación 
visual de éstos, y es esta visualización la que le transmite, en la medida de lo 
posible y en función de su propia calidad como elemento de comunicación, la 
información geográfica subyacente. El usuario de un SIG, salvo que utilice una 
imagen (una fotografía aérea, un mapa escaneado o un mapa ya preparado a través 
de un servicio de mapas), no recibe elemento visual alguno, sino tan solo datos 
numéricos que son, eso sí, muy susceptibles de ser visualizados. 

En relación con esto, un SIG está pensado para satisfacer dos necesidades 
fundamentales. Por una parte, la creación de cartografía a partir de los datos, del 
mismo modo que el cartógrafo utiliza otro tipo de herramientas para elaborar 
mapas a partir de los datos topográficos o temáticos de los que dispone. Por otra, 
y para el usuario cuyo fin último no es la elaboración de cartografía, visualizar de 
la mejor forma posible los datos con los que trabaja, para que esta visualización 
aporte valor añadido a los datos de cara al desarrollo de la labor de ese usuario. 
Ambos enfoques coexisten en un SIG y están orientados en cualquier caso a extraer 
de los datos la mayor información posible de forma visual. 

En definitiva, debemos tener siempre presente que en un SIG la información 
geográfica no es un elemento visual, ya que llega a nosotros convertida en última ins- 
tancia en algo puramente numérico, apto para ser procesado de un modo u otro por el 
ordenador en el que ejecutamos el SIG. Somos nosotros, a través del SIG, quienes la 
dotamos de un aspecto visual. En otras palabras, en un mapa clásico la tarea del car- 
tógrafo (que es quien prepara la información geográfica) es hacer que sea lo más fácil 
posible de interpretar para el usuario de ese mapa. En el SIG existe también alguien 
que prepara los datos (por ejemplo, un técnico que comprueba la calidad de un MDE 
y lo almacena en un formato dado), pero su objetivo es facilitar su interpretación y 
uso al ordenador (o, más concretamente, al SIG). La visualización, por lo general, 
y salvo que en esa preparación se añadan elementos adicionales que complementen 
al dato en sí, queda en manos del usuario del dato. Es por esta razón que una parte 
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como esta resulta fundamental en un libro de SIG, ya que el usuario de SIG necesita 
conocer cómo emplear el SIG para visualizar la información con la que trabaja. 


25.3. La visualización científica y los SIG 

Aunque, como decimos, el SIG hace más obvio que un mapa es la expresión 
visual de una serie de datos, la visualización de datos no es algo exclusivo de los SIG 
como aplicaciones informáticas, y en absoluto se trata de algo nuevo relacionado 
con los ordenadores y sus capacidades de representación. La creación de gráficas 
y diagramas es una realidad desde mucho antes que aparecieran los ordenadores, 
y estas son una herramienta fundamental en el ámbito científico. Visualizar series 
de datos sencillos mediante la representación de éstos ayuda a comprender su 
naturaleza y constituye un útil de gran potencia a pesar de su aparente simplicidad. 

Visualizando un dato cualquiera se obtiene una densidad de información mucho 
mayor que si ese mismo dato se representa numérica o textualmente. Asimismo, se 
estima que aproximadamente el 50% de las neuronas están dedicadas a la visuali- 
zación. Como reza la sabiduría popular, «una imagen vale más que mil palabras», 
y esta es una verdad que cobra pleno sentido dentro de campo de las ciencias. 

Se puede pensar que una representación simple tal como un diagrama de barras 
o uno de dispersión está muy alejado del tipo de representación compleja que 
un mapa supone, y que, por tanto, también es muy distinta de la representación 
que tiene lugar en un SIG. Analizándolo con un poco más de detalle vemos, sin 
embargo, que la diferencia no es tal y existen muchas similitudes y relaciones. 

En primer lugar, estas representaciones pueden aplicarse a la componente 
temática de los datos espaciales y permitir el análisis de esta. Prescindiendo de 
la componente espacial, la componente temática es susceptible de ser analizada 
mediante cualquiera de las herramientas habituales de la estadística descriptiva, 
entre ellas las del análisis exploratorio de datos tales como las gráficas y diagramas 
antes mencionados. 

En segundo lugar, existen en la actualidad otras herramientas de visualización 
de datos más avanzadas, producto del avance tecnológico de los últimos tiempos, el 
mismo que ha propiciado el salto de la cartografía clásica a la cartografía digital y 
al campo de los SIG. Si el volumen de información y sus características ha variado 
sensiblemente en lo que al ámbito geográfico respecta, otras áreas no han sido 
ajenas a transformaciones similares, lo cual ha tenido como consecuencia el desa- 
rrollo de nuevas ideas para poder visualizar esa información y poder aprovechar 
sobre ella las capacidades de percepción y análisis visual de que disponemos. El 
desarrollo en este sentido es tal que constituye en la actualidad una rama de la 
ciencia propia: la visualización científica. 

Los conceptos de la visualización científica pueden ser aprovechados por los 
SIG, que aproximan de ese modo sus funcionalidades a las de las aplicaciones de 
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Figura 25.1: Dos ejemplos de visualización científica. 


visualización genérica de datos. En algunos casos, las diferencias son meramente 
formales y debidas a los enfoques tradicionales que se vienen empleando en estos 
campos, pero la integración entre ambos es posible al menos en lo que a sus 
conceptos y fundamentos respecta. 

Consideremos por ejemplo, las representaciones de la figura 25.1. La de la 
izquierda se ha producido a partir de datos obtenidos en un túnel de viento y 
muestra las presiones ejercidas por el aire sobre un ciclista, así como las lineas de 
flujo que se forman. La de la derecha representa la actividad cerebral en un ratón 
tras un estímulo, y se ha creado en base a los datos proporcionados por un tomógrafo. 
Salvando las diferencias en cuanto al campo de la ciencia del que provienen, ambas 
representaciones guardan muchas semejanzas con, por ejemplo, las obtenidas a 
partir de un MDE, en las que habitualmente se emplea una paleta de colores similar 
para visualizar los valores de las distintas celdas. Puedes ir al capítulo 13 para 
encontrar un buen número de ellas y comprobar por ti mismo esa similitud. 

Aunque puedan parecer algo muy alejado de lo que entendemos por SIG y del 
trabajo que desarrollamos con uno de ellos, lo cierto es que representaciones así 
podrían perfectamente formar parte de un proyecto SIG, al menos en teoría. Si 
pensamos en la primera de ellas, la del ciclista, no es raro en la actualidad que un 
SIG 3D permita cargar modelos tridimensionales tales como edificios o árboles, por 
poner dos ejemplos (veremos esto con detalle algo más adelante en esta misma parte 
del libro). De este modo, no es tan descabellado pensar en disponer en un SIG de 
los datos de la forma de ese ciclista, datos que, por otra parte, son de tipo espacial y 
encajan perfectamente en el tipo de datos que un SIG maneja. De hecho, el modelo 
que ha servido para calcular esos datos de presión podría aplicarse mediante las 
capacidades de modelización de un SIG, y podría estudiarse un supuesto en el que se 
conocieran los datos de viento de una determinada zona. Es decir, situar al ciclista en 
una calle dada y con unas condiciones concretas y efectuar el cálculo que nos llevaría 
a unos datos similares a los representados en la imagen. Siendo posible realizar ese 
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cálculo en un SIG, visualizar esos datos resultantes a través de una representación 
como la mostrada es, sin embargo, algo que no resulta aún posible en un SIG, y 
es necesario el concurso de una aplicación especializada de visualización científica. 

Así pues, las imágenes de la figura 25.1 no han sido creadas con un SIG, sino 
con sendas aplicaciones de visualización científica de ese tipo. Estas aplicaciones 
presentan funcionalidades distintas a las que tiene un SIG, siendo habitualmente 
más avanzadas y con un mayor grado de interactividad. Asimismo, están pensadas 
para la representación de datos multidimensionales, algo que no sucede con los SIG 
[381] . La diferencia principal estriba en que, mientras que la visualización en el SIG 
complementa al análisis y a otras operaciones sobre los datos, en la visualización 
científica esta es el análisis, y el objetivo único de la visualización es facilitar 
el análisis visual de los datos. Este es el motivo por el que aparecen funciones 
avanzadas de tipo interactivo que permiten al usuario «jugar» con los datos, 
alterando su representación para hacer más explicita la información que contienen. 

Si estas funcionalidades avanzadas no aparecen en los SIG en la actualidad, esto 
no obedece a una imposibilidad técnica o a que carezca de sentido implementarlas, 
sino más bien al enfoque predominante en el diseño de los SIG, que en lo que a 
visualización respecta se asemeja mucho aún a la cartografía clásica. Aunque los 
SIG 3D van ganando terreno, la idea clásica de visualización en un SIG hereda 
directamente del mapa tradicional, y se constituye en muchos casos como una 
mera herramienta para crear este, sin considerar que puede ser posible la creación 
de otro tipo de representaciones. 

Las limitaciones en cuanto a visualización también se deben en parte a las 
limitaciones en los datos, ya que un SIG no es de momento la herramienta ideal para 
el manejo de datos multidimensionales, a pesar de que estos abundan en el ámbito 
geográfico. Hemos estudiado mucho acerca de los datos espaciales en este libro, y 
la mayor parte de cuanto hemos visto se basa en el uso de geometrías planas o, en 
todo caso, tridimensionales, siendo extraño el trabajo con otros datos, al menos en 
los SIG de uso genérico. Existen, por ejemplo, modelos para mallas de datos multi- 
dimensionales, pero las capas ráster tal y como las hemos estudiado son puramente 
bi dimensionales. Mientras haya carencias en los modelos de datos y en la concep- 
ción del dato geográfico, es lógico entender que las capacidades de visualización de 
los SIG también presenten deficiencias a la hora de trabajar ciertos tipos de datos 

El uso combinado de aplicaciones para visualización científica y SIG es la solu- 
ción actual a determinados problemas de visualización que exceden las capacidades 
habituales de estos últimos. En este sentido, se han producido acercamientos entre 
ambos tipos de aplicaciones para tratar de conseguir que esta combinación no se 
lleve a cabo tan solo mediante una mera compartición de datos (uso de formatos 
comunes que permiten «pasar» los datos de una aplicación a otra), sino que exista 
una verdadera integración que reduzca la redundancia de funcionalidades y ma- 
ximice las posibilidades. Por el momento, la plena integración dista mucho de ser 
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Geovisualización 


Figura 25.2: El cubo cartográfico. 


una realidad, por lo que debe recurrirse a la utilización conjunta de una u otra 
manera. En [382] puede encontrarse este tema desarrollado con más profundidad. 

Aunque en los SIG faltan muchos de los elementos y de las capacidades de 
las aplicaciones de visualización científica, algunas ideas de esta sí que aparecen 
en ellos, y en su conjunto amplían la potencialidad del mapa como metáfora de 
una realidad que se representa. La más básica de todas ellas es la interactividad 
que permiten las herramientas de navegación. Aunque lejanas de lo que podemos 
encontrar en aplicaciones de visualización científica especializadas, ofrecen un 
respuesta por parte del mapa a las acciones de quien lo utiliza. Frente al carácter 
pasivo del mapa impreso, las representaciones dentro de un SIG son activas. 

Otros elementos menos frecuentes son la incorporación de animaciones y la 
visualización tridimensional. Sin ser equiparable a las capacidades de represen- 
tación multidimensional de un programa de visualización científica, esta última 
supone, no obstante, un salto cualitativo enorme frente al carácter bidimensional 
del mapa impreso. En el capítulo 28 veremos más acerca de las representaciones 
tridimensionales y las animaciones. 

Este nuevo enfoque que se produce en el ámbito cartográfico al incorporar 
parte de las ideas de la visualización científica se conoce como geovisualización , 
y conforma una rama de esta última dedicada al caso particular de visualizar 
la información geográfica. Una forma muy gráfica de ver la diferencia entre el 
documento cartográfico clásico y la geovisualización que se produce dentro de un 
SIG es mediante el denominado Cubo cartográfico [383] (Figura 25.2). 

El cubo cartográfico contiene tres ejes, en los cuales se representan el grado 
de interactividad, el objetivo principal de la representación y la audiencia a la 
que esta se dirige. La cartografía clásica y la geovisualización se sitúan en vértices 
opuestos, ya que presentan características distintas en estos tres conceptos. El 
mapa clásico esta pensado para presentar una información de la que ya se dispone, 
pero no es una herramienta para descubrir nueva información. La geovisualización, 
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por el contrario, con la posibilidad que ofrece al usuario de «explorar» los datos, 
puede servir para extraer información que no se conocía de antemano a la hora de 
crear la representación. La interactividad es alta en la geovisualización y baja en el 
mapa clásico, como ya hemos visto. Por último, la audiencia en la geovisualización 
es privada, entendiéndose con esto no que existan restricciones para su acceso, 
sino que en su mayoría son representaciones fugaces que cambian según el usuario 
interactúa con el software , y por tanto lo normal es que solo sea ese usuario quien 
las disfrute, no teniendo un carácter persistente como el mapa impreso. 


25.4. Los SIG frente a las aplicaciones de diseño 

Pese a que, como acabamos de ver, la visualización en un SIG va mucho más 
allá del mapa tradicional, resulta indudable que la creación de este es una tarea 
fundamental y que los SIG han de responder a esa necesidad como herramientas 
primordiales para el cartógrafo y el diseñador. No obstante, como ya se mencionó 
en 22.2.5, las necesidades del cartógrafo van a menudo más allá de los que un SIG 
puede ofrecer, siendo necesario recurrir a programas de diseño del mismo modo que 
sucede con las aplicaciones de visualización científica. Esto es así, principalmente, 
debido a que la labor del cartógrafo contiene un elemento artístico (que es, a 
su vez, puramente visual) que los SIG no están preparados para manejar. El 
SIG es una herramienta demasiado «estricta» en este sentido, ya que realiza una 
representación de los datos donde prima la exactitud y la corrección, sin dejar 
lugar para licencias que, si bien mejorarán la calidad del mapa como medio de 
transmisión de información, suponen un elemento fuera de la ortodoxia del SIG. 

Así, un cartógrafo puede necesitar representar un punto o una línea desplazada 
de su localización real o deformar algún elemento, y esto es algo que, en general, 
un SIG no permite. En realidad, no es algo imposible de hacer en un SIG, sino, 
por el contrario, algo sencillo. Bastaría modificar los datos para adaptarlos a la 
visualización que queremos obtener. De este modo, no obstante, estamos alterando 
el dato y creando uno nuevo incorrecto, lo cual afectará a cualquier otro uso 
posterior que se haga de esté más allá de su visualización. Es decir, el SIG no 
permite mantener la corrección de los datos y al mismo añadir esas «incorrecciones» 
que forman parte de las herramientas del cartógrafo a la hora de crear cartografía. 

La solución es, como hemos dicho, hacer uso de aplicaciones de diseño que 
no tienen en consideración el significado de los elementos gráficos y no plantean 
restricciones como las anteriores. Esto puede llevarse a cabo operando con el SIG 
para crear una primera representación que luego se edita en un programa de 
diseño gráfico para retocar aquellos elementos que puedan mejorarse mediante 
el buen hacer del cartógrafo experimentado. En particular, el uso de software de 
ilustración vectorial es la opción más adecuada para la elaboración de mapas. Este 
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planteamiento supone, sin embargo, una integración muy débil y que presenta 
numerosos inconvenientes, entre los cuales cabe citar los siguientes: 

■ Incapacidad de la aplicación de diseño para analizar los datos. La 
representación puede hacerse de forma completamente manual, creando 
cada uno de sus elementos y definiendo sus características sin la ayuda de 
ninguna rutina, pero también puede llevarse a cabo haciendo uso de alguna 
funcionalidad suplementaria. Por ejemplo, para establecer los colores de los 
distintos polígonos de una capa puede usarse el valor de uno sus atributos 
y establecer una rampa de colores en función de este. El SIG puede hacer 
esto automáticamente, pero una aplicación de diseño, puesto que no puede 
interpretar esos atributos y carece de esa funcionalidad, requerirá que el 
cartógrafo lleve a cabo esa asignación de colores de modo manual. 

■ Dificultad de actualización. Al no estar la representación sincronizada 
con la base de datos, las modificaciones en esta no le afectan, y es necesario 
rehacer los mapas cada vez que los datos cambien, ya que esa actualización 
no se produce de forma automática. 

■ Nula o muy limitada capacidad de automatización de tareas. Un 

SIG puede automatizar tareas tales como la subdivisión de un mapa en 
submapas menores (véase la imagen 22.5) o la producción de mapas sobre un 
conjunto de capas. Por ejemplo, podemos «mostrarle» al SIG cómo queremos 
el diseño del mapa de una variable dada y que él se encargue de generar los 
mapas de ese modo para otra serie de variables recogidas en otras tantas 
capas en nuestra base de datos. Puesto que la aplicación de diseño gráfico 
no puede por sí misma acceder a esa base de datos, esta automatización no 
es posible en caso de crear cartografía con ella. 

■ Mayor posibilidad de introducir errores cartográficos. La permisivi- 
dad de una aplicación de diseño gráfico es un arma de doble filo. Por una lado, 
permite al cartógrafo tomarse ciertas licencias cuando ello resulta necesario, 
pero también cuando no es correcto hacerlo. La aplicación no entiende, por 
ejemplo, que la orientación del mapa no debe variar si no lo hace también la 
rosa de los vientos o que el canevás (la rejilla que acompaña al mapa) debe 
estar correctamente situado, y permite que se introduzcan errores que en 
un SIG se encuentran completamente controlados. 

Al contrario de lo que sucedía con las herramientas de visualización científica, 
los SIG sí que van progresivamente incorporando la ideas de estas aplicaciones 
de diseño gráfico, permitiendo cada vez más la labor artística del cartógrafo y 
adaptándose a sus necesidades igual que se adaptan a las de otros usuarios con 
requerimientos distintos de visualización. Aún así, este tipo de capacidades deben 
considerarse como algo avanzado que pocos SIG incorporan, ya que la mayoría 
de ellos se centran en la visualización dentro de su propio entorno y solo permiten 
la elaboración de cartografía rudimentaria o, al menos, lejos de los estándares de 
la producción cartográfica clásica. 


25.5. Resumen 


La visualización es parte vital de los SIG y por ello estos disponen de abundantes 
funcionalidades para la representar la información geográfica. Existen, no obstante, 
importantes diferencias entre la creación de una representación dentro de un SIG 
y la labor tradicional del cartógrafo. Desde el punto de vista conceptual, una 
diferencia fundamental es el hecho de que el usuario de la información geográfica 
en un SIG no la recibe en un formato visual, sino como meros datos numéricos, 
siendo él quien ha de procurarse esa representación visual. 

La visualización de datos es en la actualidad un apartado de gran importancia 
no solo en el campo del SIG, sino en todo el ámbito científico en general. Las aplica- 
ciones existentes para la visualización de datos de diversa índole superan en muchas 
ocasiones a los SIG en cuanto a sus capacidades, especialmente en el manejo de datos 
multidimensionales y la interactividad entre el usuario y la representación. El uso 
conjunto de estas aplicaciones y los SIG amplia las posibilidades de estos, que por 
el momento no incluyen dichas capacidades avanzadas entre sus funcionalidades. 

Otras aplicaciones que complementan a los SIG en lo que a la producción de 
cartografía respecta son las empleadas en el diseño gráfico. Las funcionalidades 
de estas, no obstante, sí que están siendo incorporadas progresivamente por los 
SIG, de tal modo que éstos cada vez van siendo herramientas más completas que 
ofrecen todo lo necesario para la creación profesional de cartografía. 



Capítulo 26 


Conceptos básicos de visualización y representación 


Puesto que tratamos la visualización de la información geográfica, resulta necesa- 
rio conocer algunas de las ideas fundamentales acerca del lenguaje visual para usar este 
adecuadamente. Con estas, sabremos cómo hacer mejores representaciones visuales para 
transmitir una información dada, aprovechando las propiedades de los elementos del len- 
guaje de un modo óptimo. Los conceptos que se detallan en este capítulo pueden aplicarse 
a cualquier tipo de representación visual, por lo que podremos posteriormente trasladarlos 
al contexto de la cartografía. 


26.1. Introducción 

Cuando visualizamos cualquier tipo de información geográfica, ya sea a través 
de un mapa clásico o de algún elemento gráfico en la pantalla de un ordenador, 
estamos utilizando un lenguaje visual para transmitirla. Del mismo modo que al 
hablar empleamos un lenguaje oral y al escribir un lenguaje escrito, siempre que 
plasmemos la información geográfica en una serie de elementos visuales estaremos 
empleando este lenguaje visual. 

Existen muchas similitudes entre el lenguaje visual y el lenguaje que utilizamos 
cada día para comunicarnos, comunes todas ellas a cualquier forma de lenguaje. 
Por una parte, disponemos de una serie de elementos básicos que podemos usar, 
que son como las palabras con las que formamos frases y expresamos ideas. Estas 
se combinan de acuerdo con unas normas y siguiendo esquemas definidos que 
conocen tanto el creador del mensaje como el receptor, y sin los cuales no seria 
posible establecer la comunicación. Por otra, el conocimiento y manejo adecuado 
de todos estos elementos define nuestra capacidad de emplear el lenguaje y expresar 
correctamente aquello que queremos transmitir. 

Al igual que en el lenguaje hablado, y por su carácter simbólico, el lenguaje 
visual implica la existencia de unas limitaciones. Es decir, no podemos expresar 
todo aquello que tratamos de representar, y un mapa nunca puede contener y 
transmitir fielmente toda la realidad de una zona o de un fenómeno espacial dado. 
Sin embargo, un correcto uso del lenguaje permite comunicar gran cantidad de 
información y hacer de este una herramienta de gran utilidad, más allá de sus 
limitaciones, o incluso aprovechando estas para su propio beneficio. 
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El estudio de los signos de un lenguaje constituye lo que se conoce como semio- 
logía. En el caso de los elementos del lenguaje visual, encontramos una semiología 
gráfica, tal y como la definió el cartógrafo francés Jacques Bertin, pionero en este 
campo [384], Esta semiología trata los signos del lenguaje visual y la gramática 
de estos, definiendo una lingüística visual que nos ayuda a comprender cómo una 
representación gráfica dada cumple su propósito de transmitir la información en 
base a la cual se crea. 

Detallando las ideas de Bertin, en este capítulo veremos algunos aspectos 
fundamentales acerca del lenguaje visual que nos permitirán conocer sus propie- 
dades y la forma en que sus elementos pueden emplearse de forma efectiva para 
la comunicación. Aplicando estos al caso particular de representar y visualizar 
información cartográfica, expandiremos este en el próximo capítulo para obtener 
un lenguaje cartográfico, fundamental para la creación de mapas. 


26.2. Las variables visuales 

Cada lenguaje tiene sus propiedades particulares y permite expresar unas u 
otras ideas de distintas maneras. Por ejemplo, podemos plasmar la música en 
una partitura, utilizando un lenguaje de signos musicales. Este lenguaje musical 1 
permite recoger y transmitir una canción a través de una partitura, expresando 
mediante un conjunto de símbolos las distintas notas que la componen, su duración 
o los elementos expresivos que deben incorporarse en la interpretación de esta. Un 
músico que conozca este lenguaje puede interpretar una pieza gracias a que la mú- 
sica le llega a través de esos símbolos, siendo la partitura el medio de comunicación 
entre el interprete y el compositor o quien haya transcrito dicha pieza. 

Aunque dos personas conozcan a la perfección el lenguaje musical, no podrán, 
sin embargo, transmitirse mediante sus símbolos y sus reglas algo como una for- 
mula matemática o un poema. El lenguaje matemático o el lenguaje oral son los 
adecuados para transmitir este tipo de mensajes, pero no el lenguaje musical, que 
tiene limitaciones en ese sentido. 

Puesto que nuestro objetivo a lo largo de los capítulos de esta parte del libro 
es ser capaces de crear mapas y otros elementos visuales que transmitan la infor- 
mación geográfica, debemos estudiar qué clase de información vamos a transmitir 
y, sobre todo, qué nos permite transmitir el lenguaje visual. Del mismo modo 
que sabemos que los símbolos de nuestro lenguaje musical (pentagrama, figuras, 
etc.) no son capaces de transmitir una formula matemática, debemos ver si los 
elementos del lenguaje visual van a ser capaces de, por ejemplo, transmitir el 
patrón de distribución de un fenómeno en el espacio, las diferencias entre dos zonas 
distintas o la relación entre los valores de una variable en dos puntos. Además, 

1 Entiéndase que hablamos aquí de ese lenguaje de signos sobre un papel y no del lenguaje 
musical relativo a una forma de expresión a través del ritmo, el tono, etc. 
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debemos ver cómo emplearlos para que esa información se transmita de la mejor 
manera posible, ya que existen diversas propiedades de los elementos visuales que 
podemos emplear, siendo más adecuadas unas u otras según sea la circunstancia. 
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Figura 26.1: Ejemplo de uso de las distintas variables visuales. De izquierda a derecha: 
posición, forma, tamaño, tono, valor, textura, y orientación 

Estas propiedades conforman lo que se conoce como variables visuales , y se 
aplican a los elementos básicos de la representación, que son aquellos objetos 
geométricos de que se compone esta. Las variables visuales permiten diferenciar 
unos de otros y asignarles unas ciertas características, susceptibles a su vez de 
ser interpretadas junto al propio significado que el objeto pueda tener. Dados dos 
elementos, estos pueden diferenciarse por las siguientes variables, que aparecen 
representadas en la figura 26.1: 

■ Posición 

■ Tamaño 

■ Forma 

■ Textura 

■ Color 

■ Orientación 

Todas ellas constituyen las variables visuales, que estudiaremos seguidamen- 
te en detalle. El color, como explicaremos, se divide en dos variables visuales 
independientes: valor y tono. 

Las variables visuales se aplican de forma distinta en función del tipo de elemento 
que queramos simbolizar, por lo que detallaremos su uso para las tres clases de 
símbolos que podemos incorporar en un mapa: puntuales, lineales y de superficie. 

26.2.1. Posición 

La posición constituye un caso particular de variable visual a la hora de emplear- 
la en la creación de cartografía, ya que viene fuertemente condicionada por el hecho 
de que todo aquello que representamos tiene una posición en el espacio y, por tanto, 
ha de tener una posición concreta en el mapa. Mientras que en cualquier otro tipo 
de gráfico la posición puede modificarse a voluntad para transmitir algún tipo de in- 
formación, tal y como haremos con las restantes variables visuales, en el caso de un 
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mapa la posición ya está asociada a una información que ha de transmitir: la informa- 
ción sobre la posición real en el espacio geográfico de aquel objeto que se simboliza. 

Aunque el cartógrafo puede en determinadas ocasiones variar la posición de 
algunos elementos (por ejemplo, para mejorar la legibilidad del mapa), siempre 
está supeditado a la corrección cartográfica, y no posee libertad para alterar esta 
de cualquier modo. Por ello, el uso de la posición como variable visual está muy 
restringido en el caso de un mapa, y no se emplea. Su escasa aplicación en ese sentido 
queda patente en el hecho de que en algunos textos no se menciona junto a las 
restantes variables visuales, detallándose por separado como un elemento distinto. 

26.2.2. Forma 

La forma viene definida por el perímetro exterior del objeto. Esto no implica 
que únicamente se pueda aplicar la forma a símbolos de superficie, ni tampoco 
que se debe tratar de un perímetro cerrado como el de una forma poligonal. 

La forma se aplica fundamentalmente a los símbolos puntuales, situando un 
símbolo de una forma dada sobre las coordenadas exactas del punto a representar. 
Su aplicación a símbolos lineales es difícil y no se da, mientras que en el caso 
de aplicarse sobre símbolos de superficie requiere la alteración de los polígonos 
representados (por ejemplo, que tracen los límites de países), dando lugar a una 
representación imprecisa, al menos en lo que al contorno del polígono respecta. 
Esto se produce únicamente en el caso de los denominados cartogramas, un tipo 
particular de mapas que veremos en el próximo capítulo. 

26.2.3. Tamaño 

El tamaño se refiere a la dimensión del símbolo. Para el caso de símbolos pun- 
tuales, puede aplicarse sin más que hacer más grande o pequeño el símbolo en sí. En 
el caso de líneas, el grosor de estas constituye la forma de aplicar la variable tamaño. 
Al igual que sucedía con la forma, en las superficies va a implicar la modificación de 
estas, por lo que se emplea únicamente en los cartogramas. Otra forma de aplicar el 
tamaño a los símbolos superficiales es hacerlo sobre la textura con la que estos se re- 
llenan, usando un único patrón con diferentes tamaños en sus tramas (Figura 26.2). 



Figura 26.2: Uso del tamaño en símbolos de superficie mediante texturas. 
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El tamaño condiciona la percepción de otras variables visuales, especialmente 
cuando se trata de tamaños pequeños. Un punto muy pequeño o una línea dema- 
siado fina no van a permitir la aplicación de, por ejemplo, el tono o el valor, o al 
menos no del mismo modo que con un tamaño mayor, ya que la percepción de 
estas variables será más difícil. 

26.2.4. Color 

La variable color es la más importante de todas las variables visuales, y la 
que a su vez requiere un grado mayor de detalle en su exposición, debido a la que 
complejidad que presenta y a las posibilidades que ofrece 2 . 

Existen muchas formas de representar y crear un color, a través de los deno- 
minados espacios de color. De cara a su uso como variable visual en el contexto 
de este capítulo, resulta de especial interés el uso del espacio de color HSV, en el 
cual un color se define mediante un espacio de coordenadas cilindrico, según lo 
mostrado en la figura 26.3. 



Figura 26.3: Espacio de color HSV explicando el significado de las componentes tono 
(H), saturación (S) y valor (V) (adaptado de Wikipedia). 

Tres son las componentes de un color, las cuales establecen sus coordenadas en 
el cilindro: tono (H, de Hue en su denominación inglesa), valor (V) y saturación (S). 

El tono es lo que en el lenguaje común denominaríamos color, es decir el nombre 
del color, por ejemplo verde, rojo o amarillo. Está relacionado con la longitud 
de onda de la luz, y distintas longitudes de onda producen un efecto perceptivo 
distinto, haciendo que distingamos así los diferentes colores. En el cilindro del 

2 Si estas leyendo una copia impresa de este libro, es posible adquirir esta tanto en versión a 
color como en versión en blanco y negro. En caso de usar esta última, no vas a poder apreciar 
correctamente algunas de las imágenes de este capítulo, por lo que te recomiendo acudir a la versión 
digital del libro (recuerda, este es un libro libre y puedes obtener esa versión de forma gratuita en 
el página Web del libro), al menos para este capítulo, o, mejor aún, para toda esta parte dedicada a 
la visualización. Otros capítulos en otras partes del libro también presentan figuras en color, pero 
pueden ser interpretadas igualmente en blanco y negro. En las de este, no obstante, el uso del color 
es más relevante y será mejor utilizar una versión con figuras a todo color, ya sea impresa o digital. 
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espacio de color, el tono viene marcado por el ángulo del vector definido por la 
posición del color y el eje central, sobre el plano perpendicular a dicho eje. 

El tono puede verse alterado por los tonos del entorno, especialmente en símbo- 
los de pequeño tamaño. Aunque es una variable para la que la percepción humana 
tiene gran sensibilidad, en los símbolos pequeños puede ser difícil de identificar y pue- 
den producirse una falsa percepción si comparten espacio con otras más grandes de 
un tono distinto. Por ejemplo, al trazar una linea con un grosor fino que atraviesa una 
serie de polígonos de distintos colores, el tono de esta se percibirá como distinto en 
cada uno de esos polígonos por el efecto que sus colores causan como colores de fondo. 

Por su parte, el valor indica la claridad del color. Un tono azul puede ser 
más claro o más oscuro sin dejar de ser azul. Esa variación que se produce es una 
variación del valor del color. En el caso de usar una tinta de un color dado, la mezcla 
de esta con una pintura blanca produce una disminución del valor, aclarándose 
progresivamente según añadimos más de esta última en la mezcla. A la hora de 
imprimir se hace uso de tramas más o menos densas para modificar el valor, sin 
modificar así la tinta. Según el espacio en blanco que se deja entre los puntos de tinta 
impresos, se consigue la apariencia de un color de mayor o menor valor. El valor 
se define en el cilindro de coordenadas como la altura del color sobre el eje central. 

La capacidad de diferenciar dos símbolos con valor distinto varía en función 
del tipo de símbolo. Así, es mayor en el caso de símbolos de superficie, mientras 
que en el caso de símbolos puntuales y lineales está relacionada con el tamaño. Si 
el punto es muy pequeño o la línea muy delgada, es más difícil apreciar el valor 
y, por tanto, comparar este con otro o extraer la información que mediante esa 
variable visual se intenta transmitir. 

La saturación, por último, expresa la pureza relativa del color. Depende del 
número de distintas longitudes de onda que aparecen en un color dado. A medida 
que disminuye la saturación, el color va pareciendo más grisáceo, y el número de 
longitudes de onda es mayor. En el cilindro del espacio de color queda definido 
por la distancia del color al eje central. 

En lo que al color como variable visual respecta, cada una de estas componentes 
de un color son a su vez variables visuales, y como tales pueden emplearse para 
simbolizar los distintos elementos de un mapa. En la práctica, el tono y el valor son 
utilizadas muy frecuentemente, pero la saturación tiene una utilidad muy limitada, 
por lo que es muy infrecuente su uso. En lo sucesivo, por tanto, trataremos el color 
no como una única variable visual sino como dos distintas: valor y tono. 

Si tienes un programa de dibujo o de edición de imágenes, puedes experimen- 
tar construyendo colores según sus componentes, usando el habitual selector de 
colores. Si no, prueba en la siguiente dirección Web, donde encontrarás un selector 
de colores on-line: http : //www . dgx . cz/tools/ colormixer/ stripe . php?hsv= 
space°/„20color. 

La figura 26.4 muestra el aspecto de un selector de colores, en el que puede verse 
cómo estos pueden definirse mediante sus componentes tono (H), saturación (S) 
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y luminosidad (L). Aunque no es exactamente el mismo concepto, la luminosidad 
cumple el papel del valor en este contexto, y este modelo (HSL en lugar de HSV) 
es el que encontramos con carácter habitual en las herramientas de este tipo para 
definir un color. 


i Color uniforme 


RGB HSL | CMYK | Rueda | CMS | 



| I I I II I II I I Hli— I J 


Figura 26.4: Selector de colores mediante sus componentes tono (H), saturación (S) y 
luminosidad (L) . La componente de la parte inferior es la denominada alpha , que indica 
la transparencia del color. 


26.2.5. Textura 

La textura hace referencia al relleno de un símbolo mediante algún patrón. 
Empleando patrones distintos se produce una diferenciación en los símbolos co- 
rrespondientes. 

En el caso de los símbolos puntuales, la textura requiere que estos tengan un 
tamaño suficiente para que pueda apreciarse el patrón que constituye cada una 
de las texturas. Este tamaño mínimo requerido es mayor que en el caso de emplear 
el tono o el valor. 

En el caso de líneas, entendemos como textura el uso de guiones y espacios en 
blanco que dan lugar a un patrón de discontinuidad, como se muestra en la figura 

26.5. No obstante, esta discontinuidad es una desventaja a la hora de representar 
un elemento lineal, ya que implica que una parte de él no va a representarse. 
Dependiendo del significado de aquello que representemos, el uso de texturas en 
elementos lineales puede no ser lo más recomendable a la hora de crear un mapa. 
Puede emplearse otro tipo de texturas para formar líneas, «rellenando» estas si 
tienen un grosor considerable, pero su uso no se recomienda. 

Las texturas se aprovechan plenamente sobre los símbolos de superficie, ya que 
la mayor dimensión de estos permite una percepción completa y una interpretación 
mucho más sencilla, al igual que ocurría en el caso del valor. 
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Figura 26.5: Aplicación de la variable visual textura a los símbolos lineales. 

26.2.6. Orientación 

La última variable visual es la orientación. Se aplica sobre los símbolos puntua- 
les, siempre que estos no presenten simetrías que impidan percibir correctamente la 
orientación. Por ejemplo, para el caso del círculo, resulta obvio que no tiene sentido 
aplicar la orientación como variable visual. Los símbolos compuestos por formas 
geométricas son adecuados para emplear la orientación, mientras que los símbolos 
pictóricos no responden de igual forma y producen en la representación sensación 
de desequilibrio. Se recomienda, por tanto, emplear esta variable únicamente con 
los primeros. 

Puede aplicarse también sobre los símbolos de superficie a través de la textura, 
variando la orientación de esta. Sobre las líneas, no obstante, su aplicación no 
es posible. Puede emplearse en caso de líneas con textura, pero esto requiere un 
ancho excesivo para una correcta percepción. 

26.3. Las propiedades de las variables visuales 

Las variables que acabamos de ver son ahora nuestras herramientas que em- 
plearemos para simbolizar la información geográfica y sabemos ya cómo aplicarlas. 
Lo que no hemos visto aún es qué capacidades tienen y qué podemos simbolizar 
mediante ellas, y este es realmente el aspecto clave sobre el que deberemos decidir 
posteriormente cuando nos dispongamos a crear un mapa, para así seleccionar la 
variable visual más adecuada en función de aquello que queramos representar. 

Se distinguen 4 propiedades básicas que una variable visual puede presentar: 

■ Asociativa. Una variable visual presenta la propiedad asociativa si al ser 
aplicada no aumenta ni disminuye la visibilidad de un elemento. Es decir, 
cuando en función de esa variable visual no puede asignársele más o menos 
importancia a este. 

■ Selectiva. La propiedad selectiva la presentan aquellas variables visuales 
que, al ser aplicadas, generan distintas categorías de símbolos. 
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■ Ordenada. Cuando una variable visual puede emplearse para representar 
un orden, se dice que presenta la propiedad ordenada. 

■ Cuantitativa. Cuando, además del orden, una variable puede mostrar can- 
tidades o proporciones, entonces se dice que posee la propiedad cuantitativa. 

El orden en que se han presentado estas propiedades no es casual, ya que están 
ordenadas dando lugar a lo que Bertin denomina niveles de organización. La pro- 
piedad asociativa se sitúa en el nivel más bajo, mientras que la cuantitativa ocupa 
el más alto. El nivel de organización de las variables visuales tiene importancia 
a la hora de combinar varias de ellas en un símbolo, como veremos más adelante. 
Asimismo, y como detallaremos en el capítulo siguiente, el nivel de organización 
define qué tipo de información podemos transmitir con una variable visual. 

Para ver más exactamente el significado de estas propiedades, estudiemos con 
detalle la figura 26.6, que muestra diferentes representaciones de un conjunto de 
símbolos (en este caso, símbolos puntuales) en los que en cada caso se ha utilizado 
únicamente una variable visual. 

Comenzando con la propiedad asociativa, vemos que a excepción del tamaño 
y el tono, las demás variables visuales no hacen que los elementos presenten una 
preponderancia en la imagen. No existen una orientación que podamos definir 
como más importante, ni tampoco un color. Lo mismo sucede con la textura, la 
forma y la posición. Podemos emplear una u otra forma, o una u otra textura, y 
con ello no conseguiremos llamar más la atención sobre un elemento en cuestión. 

Con el tamaño, sin embargo, resulta claro que mayor tamaño implica un papel 
destacado dentro de la información que transmite el mapa. De igual modo, un mayor 
valor (un color más oscuro) da sensación de mayor definición, y centra la atención de 
observador sobre el elemento de un modo muy superior a como lo hace un valor bajo. 

Respecto a la propiedad selectiva, diremos que una variable visual la presenta si 
de un vistazo podemos rápidamente seleccionar los elementos que pertenecen a un 
determinado grupo, identificados estos mediante dicha variable visual. El caso más 
claro de propiedad selectiva lo presenta el tono. Podemos rápidamente quedarnos 
solo con los elementos amarillos o con los rojos. Aunque no de un modo tan claro, 
todas las restantes variables presentan igualmente esta propiedad, a excepción de 
la forma. La forma no permite que los elementos se agrupen de modo espontáneo en 
familias, y su validez en este sentido está muy ligada a la complejidad de dicha forma. 

La propiedad ordenada la presentan aquellas variables que permiten establecer 
un orden. Tan solo posición, textura, tamaño y valor la presentan, mientras que 
las demás carecen de ella. Por ejemplo, en la imagen correspondiente a la variable 
visual tono no podemos decir cuáles de los elementos situaríamos al principio y 
cuáles al final de una escala dada definida por esos tonos. Con el valor, sin embargo, 
sí que podemos, ya que esta escala iría de los tonos más claros a los más oscuros, 
y visualmente podemos sin dificultad distinguir los distintos niveles y ordenarlos. 

Por último, la propiedad cuantitativa la presentan aquellas variables visuales 
que permiten estimar proporciones o cantidades de forma visual. Esta propiedad 
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Figura 26.6: Representación de un conjunto de símbolos aplicando de forma individual 
las distintas variables visuales. 


es exclusiva del tamaño y de la posición, mientras que las demás no la presentan. 
Podemos visualmente estimar una distancia en comparación con otra y decir que 
es, por ejemplo, el doble de esta. También podemos ver que los círculos grandes 
en la figura correspondiente son aproximadamente el doble que los pequeños. 

El valor, que ya sabemos que presenta la propiedad ordenada, podría pensarse 
que también presenta la propiedad cuantitativa, pero no sucede así. Es difícil 
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e impreciso afirmar que un color es el doble de oscuro que otro, y lo más que 
podemos hacer es situarlo entre dos valores distintos (de ahí que posea la propiedad 
ordenada), pero no deducir una cifra que exprese una cantidad o proporción. Las 
restantes variables visuales resulta claro que no poseen esta propiedad. 

En el cuadro 26.3 se muestra un resumen de todo lo anterior. 


Asociativa 

Selectiva 

Ordenada 

Cuantitativa 



ó - ó - ó 

ó ó - ó ó 

<> <> - <> 

O 0 - - - 



o 

ó 



ó 

ó 


Cuadro 26.1: Cuadro resumen con las propiedades de las variables visuales. 


Aunque las ideas de Bertin conforman una sólida base teórica de reconocido 
valor, lo cierto es que debe permitirse cierta laxitud en la aplicación de estas, y 
no considerar que existe una dicotomía estricta en el caso de las propiedades antes 
presentadas. Hay muchos factores y circunstancias que pueden alterar la forma 
en que estas propiedades se presentan, y alterar la intensidad con que aparecen en 
unas u otras variables visuales. Por ejemplo, aunque el tono no presenta, según la 
propuesta original de Bertin, la propiedad ordenada, sí que puede emplearse para 
representar un orden en determinadas circunstancias. Si estamos simbolizando 
unos valores de temperatura, podemos establecer una transición de colores entre el 
rojo y el azul, que serán fácilmente identificados y ordenados por el observador del 
mapa, ya que el primero de estos colores se asocia habitualmente al calor y el segun- 
do al frío. En este contexto particular, el tono sí presenta la propiedad ordenada. 
En los capítulos 14 o 13 verás muchos ejemplos de representaciones en que se usan 
gradaciones de tono para simbolizar variables de tipo cuantitativo, ya sean razones 
o proporciones. Estas guardan, no obstante, cierta lógica, de tal modo que puede en- 
tenderse adecuadamente su significado. Como veremos en el próximo capítulo, esto 
también tiene relación con el tipo de mapa, de tal modo que ciertos tipos de mapas 
permiten por sus propias características el uso del tono para este tipo de variables. 

Junto a lo anterior, algunos autores (véase [385]) expanden el número de varia- 
bles visuales y se han desarrollado revisiones a las propiedades enunciadas por Ber- 
tin basadas en estudios prácticos, que demuestran cómo pueden existir variaciones 
sobre la relación entre estas y las distintas variables visuales (por ejemplo, [386]). 
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26.4. Uso combinado de las variables visuales 

Para explicar cada una de las variables visuales, hemos visto diversos ejemplos 
en los que utilizábamos cada una de ellas por separado y de forma única. Sin embar- 
go, las variables visuales pueden combinarse y, si se hace de la manera correcta, esto 
reforzará la capacidad que estas tienen para transmitir una información dada. La 
imagen 26.7 muestra algunos ejemplos de combinación de variables visuales que nos 
servirán para detallar la forma adecuada de usas varias de ellas simultáneamente. 




Figura 26.7: Combinación de variables visuales. 

El primero de los ejemplos propuestos muestra el uso combinado de las va- 
riables tamaño y forma para símbolos puntuales. Estos símbolos representan la 
profundidad del suelo medida en determinados emplazamientos, estando relacio- 
nado un mayor tamaño del símbolo con una profundidad mayor. Asimismo, se 
ha asociado un símbolo triangular a los valores más bajos, un símbolo circular a 
los intermedios y uno cuadrado a los más altos. Aunque se emplean dos variables 
visuales distintas, el resultado no es, sin embargo, mejor que en caso de emplear 
uno solo de ellos (en este caso, debería emplearse el tamaño, ya que la forma no 
presenta la propiedad cuantitativa necesaria para representar cantidades) . Lejos 
de producirse una sinergia entre el efecto de ambas variables, el resultado es similar 
al uso exclusivo del tamaño en cuanto a su capacidad de transmitir la información, 
o incluso peor, ya que la forma puede dificultar la estimación visual del tamaño, 
al ser más complicado comparar la dimensión de objetos de distinta forma. 

Pese a que no es clara la ventaja de aplicar conjuntamente las variables forma 
y tamaño, esta puede emplearse para representar cantidades, por lo que podemos 
decir que mantiene la propiedad cuantitativa que posee el tamaño. En general, al 
combinar dos variables visuales el resultado presentara las propiedades de aquella 
que tenga un mayor nivel organizativo. Puesto que la propiedad cuantitativa re- 
presenta el nivel organizativo superior, en este caso se mantiene en la combinación. 

Aún así, hay mejores formas de combinar las variables visuales para que esta 
combinación enfatice en mayor grado la información que se pretende transmitir, 
como por ejemplo la mostrada en el segundo ejemplo. Este ejemplo combina el 
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tamaño y el valor, variables ambas que no poseen la propiedad asociativa. Es 
decir, poseen su complementaria, que podríamos denominar disociativa , y que, 
recordemos, es la propiedad que, al aplicarse sobre un símbolo, hace que este gane 
importancia visual. El resultado presenta un carácter todavía más disociativo, 
en cuanto que los símbolos que representan una cantidad elevada, al ser no solo 
grandes, sino estar pintados en color oscuro, llaman aún más nuestra atención que 
si empleáramos una única de las variables visuales utilizadas. 

Como regla en este sentido, podemos decir que, cuando se combinan variables 
visuales que poseen una determinada propiedad, en el resultado esta propiedad 
queda reforzada con respecto a las variables individuales. 

El tercer ejemplo nos muestra que combinar variables visuales con una misma 
propiedad no garantiza necesariamente que se vaya a producir una sinergia entre 
ellas, sino que, por el contrario, pueden anularse. Las variables empleadas en este 
caso son las mismas, valor y tamaño, pero se ha asociado el color claro a los valores 
mayores y el oscuro a los menores, de tal modo que los símbolos de mayor tamaño 
son más claros que los pequeños. Esto atenúa el efecto disociativo del tamaño, de 
forma que la representación es más difícil de interpretar y su información no se 
transmite de modo tan inmediato y directo. 

En resumen, podemos sintetizar lo anterior diciendo que, a la hora de combinar 
variables visuales, deben tenerse en cuenta las propiedades de estas del mismo modo 
que cuando se emplean de forma individual. Las propiedades a reforzar serán aque- 
llas que convengan más al tipo de información representado, y deben presentarlas 
todas las variables a combinar para que el efecto conjunto sea más acusado. 


26.5. La percepción visual 

La percepción engloba toda la serie de procesos que convierten un fenómeno 
físico en una información acerca de nuestro entorno, a través de la estimulación 
de unos órganos perceptivos. La percepción tiene una fase física, una fisiológica (la 
estimulación en sí) y una psicológica (la interpretación del estímulo). En el caso 
de la percepción visual, este fenómeno físico es de tipo energético (la luz), y los 
órganos correspondientes son los ojos. 

El estudio de la percepción es un fenómeno complejo que no entraremos a 
detallar, pero en el que resulta de interés profundizar para conocer algo más acerca 
de cómo la información que plasmamos en un mapa (que es un elemento visual) 
acaba convertida en una información en la mente del observador de ese mapa. 
Entender este proceso, al menos someramente, nos permitirá mejorar la eficacia de 
la percepción, de forma que tengamos una mayor garantía de que la información 
que transmitimos sea recibida e interpretada correctamente. 

Dos son los aspectos que detallaremos en esta sección: las constancias percep- 
tivas y las ayudas a la percepción. En otras palabras, hasta qué punto podemos 
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modificar los elementos visuales o su entorno sin que dejen de transmitir su infor- 
mación y sean confundidos sus características, y cómo podemos facilitar que se 
perciban exactamente como pretendemos. 

26.5.1. Las constancias y contrastes perceptivos 

Entendemos por constancias perceptivas a las propiedades de los objetos cuya 
percepción no varía aunque se produzcan modificaciones. Podemos ver algunos 
ejemplos para algunas de las variables visuales que conocemos. 

Dado un objeto redondo tal como una rueda, si lo miramos en una dirección 
perpendicular aparecerá efectivamente como una forma circular perfecta. Sin 
embargo, si la miramos desde otro ángulo, veremos una forma elíptica, pero ello 
no nos lleva a pensar que la rueda en sí no sea ya redonda. Nuestra percepción de 
esa rueda es la misma, y podemos apreciar de igual modo su tamaño o su forma. 
Alterar el ángulo de visión no altera el objeto y la percepción que tenemos de él. 

Del mismo modo, un elemento pintado de un color claro se identifica como 
tal aunque la luz sea tenue, y un elemento oscuro lo seguimos percibiendo como 
oscuro aunque estemos en unas condiciones de iluminación fuerte. Nuestro cerebro 
es capaz de interpretar simultáneamente el objeto y el contexto, y de este modo 
extraer las características de ese objeto, que no varían. 

Estos dos ejemplos muestran la constancia perceptiva de la forma y el valor, 
y podemos buscar otros similares para otras variables visuales. 

No todas las variables visuales tienen una constancia perceptiva como la an- 
terior. Todos conocemos múltiples ejemplos de ilusiones ópticas en las que algo no 
parece lo que realmente es, y esa percepción errónea viene normalmente motivada 
por las condiciones en las que percibimos el objeto, por ejemplo debido al entorno 
particular en el que este se encuentra junto a otros objetos. La figura 26.8 muestra 
un ejemplo clásico de ilusión óptica, conocida como ilusión de Zollner. Las lineas 
largas diagonales son paralelas, pero no aparentan serlo, debido al efecto causado 
por las líneas más cortas. En este caso, no existe una constancia perceptiva de la 
variable visual orientación. 

Cuando la percepción de un elemento cambia aunque el estimulo no lo haga, 
en lugar de una constancia perceptiva hablamos de un contraste perceptivo. Los 
contrastes perceptivos son importantes, ya que pueden inducir una interpreta- 
ción errónea de la información que pretendemos transmitir, al producirse una 
percepción equivocada. 

Las siguientes son algunas de las ideas más importantes a tener en cuenta a 
este respecto a la hora de crear un mapa: 

■ El tamaño es la variable visual que más afectada se ve, y el tamaño aparente 
de un objeto puede variar notablemente si se encuentra rodeado de otros de 
un tamaño distinto. La figura 26.9 muestra un ejemplo de esto. A la hora de 
emplear simbología de elementos puntuales en un mapa (por ejemplo, en un 
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Figura 26.8: Ilusión de Zollner que demuestra el contraste perceptivo de la orientación. 

mapa de símbolos graduados, como veremos en el apartado 27.6.1), esto debe 
tenerse en cuenta, ya que pueden presentarse situaciones como la de la figura. 

■ El valor se ve igualmente alterado al situar alrededor elementos de distinto 
valor. Si el número de distintos valores es pequeño, es más difícil que aparezca 
este contraste perceptivo. A medida que se aumenta el número de estos, es 
más probable que aparezca en mayor o menor medida. 

■ El tono se ve alterado por la presencia de otros tonos distintos. En un mapa, 
veremos este efecto al enfrentar el color de un elemento sobre el color del 
fondo. Por ejemplo, si una línea que representa a una carretera y cruza una 
serie de polígonos de distinto tono, puede parecer que el tono de la línea 
varia aunque en realidad sea constante. 

■ Tonos complementarios puestos juntos pueden crear sensación de vibración 
en la frontera que los separa. 



Figura 26.9: Contraste perceptivo del tamaño. Ambos circuios grises tienen el mismo 
tamaño, pero el de la izquierda aparenta ser mayor. 


26.5.2. Ayudas a la percepción 

Con lo que hemos visto anteriormente, queda claro que podemos alterar la 
forma en que se perciben las variables visuales que caracterizan a un elemento 
visual. Podemos usar este hecho para nuestro beneficio, de tal modo que el diseño 
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de un mapa incorpore elementos que hagan más patente la información que este 
contiene, facilitando la correcta percepción del mapa en su conjunto. 

Un factor clave en este sentido es la adecuado separación entre el fondo y la 
figura. Aquello que queremos que resulte visible con carácter principal (en el caso 
de un mapa, sus distintos elementos) debe separarse de aquello que constituye el 
fondo de la imagen, y debe atraer la atención del observador de manera prioritaria. 
En caso de no ser así, puede resultar difícil «descubrir» la información que el 
mapa transmite, al quedar esta al mismo nivel que la de otros elementos de menor 
importancia. El ejemplo clásico de la figura 26.10 ilustra este hecho. Puesto que 
no existe una diferenciación clara entre el fondo y la figura, no es obvio saber si 
la imagen pretende representar una copa o dos caras. 



Figura 26.10: Sin un adecuado contraste entre fondo y figura la imagen presenta 
ambigüedad. 

En un mapa, y como veremos en el próximo capítulo, encontramos dos tipos de 
cartografía: una con carácter de base que define un contexto geográfico, y una temá- 
tica que constituye la información principal que se transmite con el mapa. Puesto 
que esta segunda es la fundamental y de mayor importancia, y la primera se incluye 
tan solo como apoyo de esta, es importante asegurarse de que esa cartografía base no 
interfiere y se mantiene en un segundo plano, constituyéndose como fondo y dejando 
que sea la información temática la que actúe como figura. Para ello podemos emplear 
las distintas variables visuales aplicadas a la cartografía base, de modo que su impor- 
tancia relativa no sea mayor que la de los elementos principales de la parte temática. 

Otro aspecto a considerar es la adecuada jerarquización entre los elementos 
del mapa. La división entre fondo y figura ya constituye en sí una jerarquización, 
pero no es suficiente si conviven varios tipos de elementos en el mapa. Dentro de 
la parte temática es necesario estructurar estos visualmente para que quede clara 
su importancia y se vea sin dificultad que existe una división entre ellos. 

Esta jerarquía debe aportar una «profundidad» a la información, de forma que 
existan niveles en esta y se perciba que algunos elementos están por encima de otros. 
Como veremos en el capítulo 28, la forma de ordenar las distintas capas en un SIG ya 
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establece un orden, aunque este no es en sí suficiente, y deben utilizarse las variables 
visuales para enfatizar o no unas o otras capas y la información que contienen. 

Algunas técnicas básicas para esto son las que permiten que exista algún factor 
diferencial en la información más relevante. Si las propiedades de los elementos 
destacados difieren notablemente de las del fondo, esto centra la atención sobre 
ellas y garantiza que no se confundan con este. Emplear unas características más 
homogéneas para el fondo permite que la diferenciación de la figura sea más patente. 
En otras palabras, el contraste, aplicado este a todas las variables visuales, es una 
de las claves para lograr una adecuada transmisión de la información al emplear 
una representación visual. 

El contraste se aplica no solo a las variable visuales, sino en general a las ca- 
racterísticas de la representación. Por ejemplo, el nivel de detalle es una propiedad 
susceptible de ser utilizada para enfatizar algo. Así, y en el caso particular del 
documento cartográfico, el lector de un mapa espera que el detalle sea mayor en 
la cartografía temática que en la de base, ya que esta última es simplemente un 
elemento complementario de ayuda. Un mayor detalle sobre ciertos elementos 
llamará más la atención en contrate con un fondo menos detallado, y esto puede 
utilizarse para enfocar la atención sobre lo más relevante. Ofrecer menos detalle en 
la cartografía de base no es un inconveniente si esto ayuda a un mejor entendimiento 
de los elementos principales del mapa. 

Como ejemplo de lo anterior, la figura 26.11 muestra un ejemplo de como una 
correcta jerarquización es fundamental para crear mapas de calidad. 




b) 


Figura 26.11: Mapa con jerarquía incorrecta (a) y mapa adecuadamente jerarquizado (b). 

Por último, un aspecto clave para la claridad de un mapa es el relativo al poder 
separador. Este define la capacidad de un individuo para distinguir objetos muy 
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pequeños y separar objetos cercanos. Además de depender del propio individuo, 
está condicionado por una serie de factores. 

Se admite en líneas generales que el límite de separación entre dos objetos 
para el ojo humano es de 0,2mm. Si existe una distancia menor entre ellos, en 
condiciones normales no será posible distinguir uno de otro. 

Existe también un límite para poder reconocer objetos aislados, aunque este 
depende del tipo de objeto. Los siguientes son algunos de los aplicados usualmente: 

■ 0,2mm de diámetro para el caso de un punto. 

■ 0,5mm de grosor para el caso de una línea negra. 

■ 0,4mm de lado para el caso de un cuadrado negro. 

■ 0,6mm de lado para un cuadrado sin relleno. 

Existe asimismo un umbral de diferenciación, que define el tamaño mínimo de 
dos objetos para que puedan ser percibidos como distintos. Este umbral también 
depende de las características de los objetos, como por ejemplo la forma (si las 
formas son muy distintas será más fácil distinguirlos que si son muy similares). 

El poder separador no depende únicamente de variables de tipo espacial, sino 
que también está en relación con otras variables visuales. Por ejemplo, una línea 
negra sobre fondo blanco puede distinguirse aunque sea fina, pero en caso de ser 
amarilla sobre ese mismo fondo, será necesario un grosor mayor. 

Como parece lógico, estos conceptos deben usarse para no incorporar a un mapa 
elementos que estén más allá del umbral de separación del lector del mapa, ya que en 
este caso no podrá extraer la información que se ha incorporado en este al crearlo. 


26.6. Resumen 

Para transmitir correctamente cualquier tipo de información mediante el len- 
guaje visual, es necesario conocer sus elementos y saber emplearlos de modo 
adecuado. La semiología gráfica se encarga del estudio de los símbolos del lenguaje 
visual, y en este capítulo hemos visto algunas de sus ideas principales. 

De especial relevancia resultan las denominadas variables visuales, las cuales 
empleamos para la caracterización de símbolos. Existen seis variables visuales: 
posición, forma, tamaño, color, textura y orientación. El color a su vez se puede 
dividir en tres: tono, valor y saturación. De estas tres, solo las dos primeras, tono 
y valor, tienen aplicación práctica en el ámbito cartográfico. 

Las variables visuales presentan distintas propiedades, que definen a su vez 
los niveles de organización. De menor a mayor organización, estas propiedades 
son las siguientes: asociativa, selectiva, ordenada, cuantitativa. Las propiedades 
de una variable visual condicionan el tipo de información que puede transmitirse 
haciendo uso de ella. Cuando se combinan varias variables visuales que poseen una 
misma propiedad, esta propiedad se presenta con mayor fuerza en el resultado. 

Podemos ayudar a que la percepción de la información que transmitimos con un 



elemento visual sea mejor, atendiendo a aspectos como el contraste entre el fondo 
y la figura, así como estableciendo una correcta jerarquización entre los distintos 
elementos. Igualmente, debemos prestar atención a los contrastes perceptivos, 
para evitar que estos aparezcan y se produzca una percepción incorrecta. 
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Capítulo 27 


El mapa y la comunicación cartográfica 


Dentro o fuera del SIG, el mapa es el medio por excelencia para transmitir la informa- 
ción geográfica de modo visual. Ser capaz de crear representaciones óptimas durante el traba- 
jo con un SIG implica ser capaz de entender cómo crear un mapa y saber escoger qué tipo de 
mapa es el más adecuado en función de la información a mostrar. En este capítulo estudiare- 
mos todo lo relativo a los mapas y sus conceptos fundamentales, así cómo las consideraciones 
necesarias a la hora de crearlos, con objeto de poder abordar en el siguiente el trabajo directo 
de visualización dentro de un SIG y analizar qué aporta este al concepto clásico de mapa. 

Para seguir este capítulo es necesario haber estudiado el capítulo anterior, ya que 
haremos uso de las ideas entonces presentadas acerca de las variables visuales. Algunos 
conceptos relativos al diseño cartográfico han aparecido ya en capítulos previos, por lo que 
no se repetirán en este. En particular, el capítulo 3 dedicado a los fundamentos cartográficos 
y geográficos contiene materia que debe conocerse antes de abordar la lectura del presente. 


27.1. Introducción 

Los mapas han sido empleados desde la antigüedad para recoger la información 
geográfica y transmitirla. Como ya dijimos en el capítulo anterior, podemos enten- 
der un mapa como un medio de comunicación visual que constituye un lenguaje con 
un objetivo particular: la descripción de relaciones espaciales. Una mapa es, pues, 
una abstracción simbólica de algún fenómeno real, lo cual significa que presenta 
un cierto grado de simplificación y generalización. 

El diseño, producción y uso de un mapa como forma de comunicación con- 
forma lo que se conoce como proceso cartográfico. Más concretamente, el proceso 
cartográfico conlleva cuatro etapas o subprocesos, a saber: 

■ Recoger los datos. 

■ Manipular y generalizar los datos para diseñar y construir mapas. 

■ Visualizar el mapa. 

■ Interpretar la información. 

La labor del cartógrafo se centra en el segundo de estos puntos, mientras que el 
usuario del mapa lleva a cabo los dos últimos. Será en esa construcción de los mapas 
en lo que nos fijemos a lo largo de este capítulo, para conocer los conceptos y reglas 
que rigen la comunicación cartográfica a través del uso de mapa. El lenguaje visual 
que estudiábamos en el capítulo 26 se convierte ahora en un lenguaje cartográfico 
al adaptarlo al caso particular de la creación de mapas, y estas reglas (equivalentes 


672 


Sistemas de Información Geográfica 


a la gramática y la sintaxis de un lenguaje hablado) son imprescindibles para 
poder crear cartografía que facilite las citadas labores del usuario posterior de 
esta. Este conjunto de ideas relativas a la producción de mapas dan forma a lo que 
conocemos como diseño cartográfico. 

El diseño cartográfico implica la toma de decisiones por parte del cartógrafo. 
Algunas de estas decisiones pueden ser la cantidad de simplificación que debe 
realizarse o los símbolos que han de emplearse para plasmar la información a 
transmitir. Las ideas desarrolladas en los próximos apartados conforman una base 
de conocimientos que facilita la toma de decisiones correctas en este sentido. 


27.2. El propósito del mapa 

Como elemento de comunicación, un mapa tiene siempre un propósito. De 
la misma forma que al hablar pretendemos transmitir algo y para ello usamos el 
lenguaje como herramienta, en el caso de crear un mapa empleamos el lenguaje 
gráfico para transmitir una determinada información geográfica. También de igual 
modo que en el caso de la comunicación verbal, y el de cualquier otra forma de 
comunicación, existe un receptor de nuestro mensaje. Es decir, un usuario (o varios) 
de ese mapa, que serán quienes lo interpreten y aprovechen. 

Esto que parece obvio es un hecho en realidad ignorado muchas veces a la hora 
de elaborar un mapa, y con ello se pierde gran parte de la capacidad del mapa 
como elemento de comunicación. Aplicar los conceptos de visualización correcta- 
mente, así como aquellos que veremos en este capítulo relativos a la simbolización, 
no garantiza que el mapa que generemos sea útil, del mismo modo que aplicar 
adecuadamente la gramática del chino para elaborar una frase no sirve de nada 
si nuestro interlocutor solo habla castellano, ya que no será capaz de interpretar 
nuestro mensaje por muy correcto que este sea. Resulta incluso mejor elaborar 
un mensaje con errores gramaticales en castellano, ya que al hacerlo así estamos 
teniendo en cuenta las circunstancias en que se produce la comunicación. 

Al crear un mapa nunca debemos olvidar quién y para qué va a usar ese 
mapa, y en función de ello elegir los elementos correctos y la forma de presentar 
la información más acorde con esos destinatarios y sus objetivos particulares. Sólo 
entonces es cuando aplicaremos los conceptos del diseño cartográfico para que el 
mensaje que elaboramos sea el mejor posible. 

La figura 27.1 muestra un ejemplo claro de lo anterior a través de sendos 
mapas con predicciones meteorológicas, proporcionados por la Agencia Estatal de 
Meteorología de España. El primero es un mapa de probabilidad de precipitación, 
mostrada esta mediante isolíneas. El segundo es un clásico mapa del tiempo 
(conocido como mapa significativo) en el que sobre el mismo territorio se sitúan 
símbolos indicando el tiempo previsto (soleado, chubascos, lluvias, tormentas, etc.). 
Ambos mapas son correctos desde el punto de vista de la labor cartográfica y se han 
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creado a partir de una misma información, pero la forma de mostrar esta es bien 
distinta. Para un uso científico, este último mapa resulta claramente insuficiente, 
mientras que el primero es adecuado. Sin embargo, si la audiencia es no especializada, 
tal como los lectores de un periódico que deseen saber si mañana podrán o no salir 
al campo a disfrutar de un día soleado, el segundo mapa es mucho mejor, ya que 
el primero, aunque también proporciona esa información e incluso lo hace con más 
detalle, puede resultar excesivamente complejo y difícil de entender si no se tienen 
ciertos conocimientos. Es decir, el usuario es en última instancia, y por encima 
del propio diseño cartográfico, quien hace que el mapa sea o no un elemento útil. 



Figura 27.1: Dos formas distintas de mostrar una información a través de un mapa. En 
función del propósito de este y el publico al que va dirigido, cada una de ellas podrá ser 
adecuada o no. (Imágenes cortesía de AEMET) 


Entre los elementos fundamentales que se han de elegir en función del propósito 
del mapa se encuentran los correspondientes a la base matemática del mapa: escala 
y proyección. La escala condicionará el tipo de estudios que será posible llevar a 
cabo con el mapa, y establecerá el nivel de detalle que se desea comunicar a través 
de este (siempre, obviamente, dentro de los limites de la escala a la que se hayan 
recogido los datos). Por su parte, la proyección debe considerarse en función de sus 
propiedades. Como ya vimos en el apartado 3.3.2, toda proyección implica algún 
tipo de distorsión. Existen así proyecciones que mantienen las áreas, las distancias 
o los ángulos. Según qué trabajo se espere con el mapa será más indicado hacer uso 
de una u otra de ellas, ya que no es lo mismo un mapa catastral que una carta de 
navegación, y la elección de una proyección inadecuada puede convertir un mapa 
en una herramienta inútil para la tarea que se pretende realizar. 

El otro aspecto importante a considerar es la forma en que transmitimos la infor- 
mación a través del mapa, es decir, el tipo de mapa, como hemos visto en el ejemplo 
propuesto. Dentro de este capítulo estudiaremos los tipos de mapas más habituales 
y las características que los definen, así como la forma de crearlos correctamente. 
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27.3. Cartografía temática y cartografía base 

Existen muchos tipos de mapas y muchas formas de clasificarlos. Una clasifi- 
cación especialmente relevante es la que divide a estos en dos grupos cartográficos 
principales en función del tipo de información que aporten: cartografía base , tam- 
bién denominada fundamental o topográfica , y cartografía temática. 

La cartografía base representa el tipo de mapa que originalmente era el objeto 
principal de la cartografía, cuando lo primordial era recoger con precisión qué 
había sobre la Tierra, documentando a través del documento cartográfico las carac- 
terísticas físicas de esta. Este tipo de cartografía requiere de medidas precisas y se 
basa fundamentalmente en el trabajo de la topografía para obtener la información 
necesaria que posteriormente se plasma sobre el mapa. 

La cartografía base tiene carácter general, y ello explica que inicialmente fuera el 
único tipo de mapa de interés para el cartógrafo, ya que existía una indudable nece- 
sidad de ese tipo de información de referencia acerca del entorno físico. Una vez que 
se ha desarrollado una colección suficiente de mapas topográficos y se conoce bien 
la Tierra a través de ellos, los cartógrafos comienzan a recoger en otro tipo de mapas 
otras variables espaciales también susceptibles de ser representadas de ese modo. Es- 
to tiene lugar alrededor del siglo XVIII, y aparece entonces la cartografía temática. 

La cartografía temática se centra en la representación de un tema concreto 
(una variable espacial dada), pudiendo esta ser de cualquier índole: física, social, 
política, cultural, etc. Se excluyen de la lista de esos temas posibles a los puramente 
topográficos, que constituyen el objeto de la cartografía base. 

La cartografía temática se apoya en la cartografía base, ya que esta se incluye 
también en los mapas temáticos para facilitar la comprensión del comportamiento 
espacial de la variable representada y ubicar esta en un contexto geográfico dentro 
del propio mapa. Un mapa temático se compone, así pues, de dos partes bien 
diferenciadas: 

■ Una capa específica con la información temática. Contiene la información 
principal del mapa, representando la variable espacial sobre la que se cons- 
truye este. 

■ Un mapa base. El mapa base provee una localización geográfica a la que se 
referencia la información temática. Debe contener los elementos propios de la 
cartografía base, aunque siempre ha de tenerse en cuenta que estos han de co- 
existir con los correspondientes a la parte temática. Por ello, frecuentemente 
es necesario incluir en este mapa base menos detalle que si se diseñara para ser 
un mapa independiente, limitándose a los elementos necesarios que definan un 
contexto geográfico básico. La labor de este mapa base no es ser utilizado como 
tal como si se tratara de cartografía base aislada, sino ayudar a los elementos 
de la componente temática a transmitir mejor la información que contienen. 
Aunque en ocasiones puede utilizarse un mapa topográfico estándar como 
mapa base, habitualmente este contiene demasiada información e interfiere 
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con la capa temática, siendo más adecuado crear el mapa base a partir 
de elementos individuales. Algunos de los más importantes son el canevás 
(rejilla de coordenadas, especialmente necesaria a escalas pequeñas), la red 
fluvial, el relieve, la vías de comunicación, las poblaciones y los nombres 
geográficos. Todos ellos son buenos elementos de referencia para permitir 
situar en base a ellos cualquier tipo de información temática. 

La mayoría de las ideas de este y el próximo capítulo se aplican fundamental- 
mente a la cartografía temática, siendo esta además la que con mayor frecuencia se 
genera mediante el uso de un SIG. Una buena parte de lo visto en relación con las va- 
riables visuales y sus propiedades tiene mayor relevancia a la hora de tratar con car- 
tografía temática, ya que esos conceptos se aplican a la representación de variables y 
fenómenos de tipo cuantitativo, y es la cartografía temática la que trabaja con ellos. 

En la cartografía topográfica, los elementos geométricos que representamos son 
en sí la información que pretendemos comunicar con el mapa, mientras que en la car- 
tografía temática esa geometría es solo parte de la información, siendo la otra parte 
la que se transmite a través del uso de variables visuales como, por ejemplo, el color. 
De otro modo, la cartografía topográfica representa «cosas» que encontramos en el 
terreno (un accidente geográfico, el curso de un río, el perfil de una costa), mientras 
que la cartografía temática se centra más en la representación de valores y atributos. 
La línea que representa una carretera en un mapa existe realmente en el terreno, 
mientras que la que representa una curva de nivel no existe físicamente. Podemos 
decir también que en lugar de en el qué, la cartografía temática se centra en el cómo. 

Según el tipo de información que contenga, la cartografía temática se divide 
en cuantitativa y cualitativa. Como veremos a continuación, el tipo de informa- 
ción tiene gran repercusión a la hora de generar un mapa, ya que condiciona los 
elementos que podemos usar para simbolizar dicha información. 


27.4. Los tipos de información y su representación 

Como vimos en el apartado 4.3, la componente temática de la información 
geográfica puede ser de tipo numérico o alfanumérico, y la primera se divide en 
los tipos nominal, ordinal, intervalos y razones. Nominal y alfanumérico represen- 
tan información cualitativa, mientras que los restantes representan información 
cuantitativa. Esta división tiene una enorme importancia a la hora de visualizar la 
información temática, ya que simbolizar esta es distinto en función de sus propias 
características, y el uso de un esquema erróneo dará como resultado un mapa en el 
que no se produce una adecuada transmisión de la información. Escoger la forma 
adecuada de efectuar esa simbolización garantizará que los elementos visuales 
comunican de la mejor forma posible toda la información a la que hacen referencia. 
Esto puede verse claramente en el ejemplo mostrado en la figura 27.2. 

Los mapas de la figura representan en ambos casos la población de los distintos 
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a) b) 

Figura 27.2: Comparación entre una representación incorrecta de la información por no 
emplear un esquema adecuado al tipo de esta (a) y una representación correcta utilizando 
un esquema coherente (b) . 


estados de México, pero en cada uno de ellos se emplea una forma distinta de 
simbolizar los valores de población. En el primero de ellos (caso a) se ha dividido la 
población en cinco clases, cada una de las cuales se identifica mediante un símbolo. 
Los símbolos han sido escogidos de forma arbitraria, y no existe una relación entre 
ellos. Por su parte, el ejemplo b) también emplea símbolos y presenta igualmente 
cinco clases, pero en este caso tienen todos las misma forma, y lo que varía es el 
tamaño. Se puede establecer una relación entre los símbolos, ya que estos pueden 
ordenarse en función de su tamaño. 

Siendo la población una variable que también puede ordenarse, el caso b) es 
claramente más adecuado, ya que nos proporciona la información visual de forma 
más rápida e inmediata. No solo responde a la pregunta ¿qué población tiene esta 
provincia ?, sino también a otras como ¿dónde está la provincia más poblada? En el 
caso a) podemos conocer también la población de una provincia y si esta es mayor 
que la de otra, pero necesitamos para ello acudir a la leyenda, ya que no resulta 
obvio que el símbolo cuadrado indique más población que el símbolo círculo. Por 
su parte, el uso de un único símbolo y la variable visual tamaño es mucho más 
intuitivo, y nos transmite esa información sin necesidad de consultar la leyenda 
del mapa. Este hecho está directamente relacionado con las propiedades de las 
variables visuales, que ya estudiamos en el capítulo 26. 

Como argumenta [384] , el primer mapa es una mapa que debemos leer, mientras 
que el segundo es un mapa que podemos ver. Puesto que un mapa es un elemento 
visual, es preferible que transmita de forma visual su información, y un mapa a 
leer supone un desperdicio tanto de tiempo como de información misma. 

Así pues, la selección de una forma de simbolización adecuada en función de la 
naturaleza de la información es clave para lograr un mapa efectivo. En particular, 
debe emplearse una variable visual que presente la propiedad (nivel de organización) 
adecuado. Las propiedades asociativa y selectiva solo son de interés para informa- 


El mapa y la comunicación cartográfica 


677 


ción cualitativa, mientras que, por ejemplo, el tamaño es la única variable visual con 
la propiedad cuantitativa, y por tanto la única adecuada para representar razones. 

Las siguientes son algunas ideas básicas a este respecto referidas a los distintos 
tipos antes citados. 

■ Nominal. La información de tipo nominal se representa adecuadamente 
utilizando la variable visual forma. Lo que representamos responde princi- 
palmente a la pregunta qué en lugar de a la pregunta cuánto , y está más 
relacionado en cierto modo con la cartografía base que con la cartografía temá- 
tica. El uso de símbolos, es decir, de la variable visual forma, para elementos 
puntuales o lineales es una solución muy eficaz y habitual en este caso. Para el 
caso de representar áreas puede emplearse la variable visual color y emplear 
distintos tonos, o bien la textura (Figura 27.3). Como dijimos en su momento, 
los tonos no presentan un orden (aunque citamos que pueden hacerlo si existe 
alguna lógica en la sucesión de estos), pero este no es necesario para este tipo 
de variables. La única propiedad que es de interés en este caso es la selectiva. 
La información alfanumérica se trata a efectos de representación del mismo 
modo que la de tipo nominal. 


Puntos 

S 

ó 


Líneas 


Polígonos 



Figura 27.3: Representación de la información nominal para los distintos tipos de 
elementos geométricos. 

■ Ordinal. A diferencia de la información nominal, en la información ordinal 
los valores definen un orden, por lo que la propiedad ordenada es necesaria 
para poder aplicarla a este caso. 

■ Intervalos y razones. Tanto intervalos como razones son tipos de informa- 
ción con más posibilidades que las anteriores, y en las que el número de valores 
que encontramos a la hora de representar un fenómeno es habitualmente 
más elevado. Frecuentemente, estos valores son de tipo real (no enteros), 
por lo que es además necesario agruparlos en clases, como veremos en un 
próximo apartado. Como en el caso anterior, pueden emplearse todas las 
variables visuales que presenten la propiedad ordenada. No debe olvidarse, 
no obstante, que la propiedad de mostrar el orden en términos de cantidades 
o proporciones, que denominábamos cuantitativa, es exclusiva del tamaño, 
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siendo este la variable visual más adecuada para representar correctamente 
este tipo de información y que al visualizar el símbolo correspondiente pueda 
estimarse el valor representado de forma intuitiva. 

En resumen, podemos condensar este apartado con una rápida «receta» de apli- 
cación general (aunque siempre con excepciones, ya que la representación y simbo- 
lización contiene, no olvidemos, elementos subjetivos), según los siguientes puntos: 

■ Para las variables cualitativas se emplean las variables visuales color, forma 
y textura, en la medida que sea posible según el tipo de objeto geométrico 
a simbolizar. 

■ Para las variables cuantitativas, el valor del color y el tamaño son las más 
adecuadas, siendo esta última la única que permite transmitir toda la in- 
formación en el caso de variables de tipo razones. El tono de color puede 
emplearse, pero debe escogerse una gama de tonos que presente algún tipo 
de lógica que permita establecer un orden. 

En la figura 27.4 se muestra un cuadro con estas breves ideas. 


Tono 


Información cualitativa 


Forma 



Textura 


Información cuantitativa 


Valor 


Tamaño 


Figura 27.4: Utilización de las variables visuales según el tipo de información. 

Por último, es de interés señalar que, aunque los niveles de organización de las 
variables visuales expresan a su vez unas posibilidades crecientes (es decir, con una 
variable como el valor o el tamaño podemos expresar todo lo que el tono puede 
transmitir, ya que están en un nivel superior), ello no implica necesariamente 
que el uso de una variable de un nivel superior es mejor que otra de uno inferior. 
Podemos ver esto claramente en la figura 27.5. En ella se ha utilizado la variable 
valor para representar un mapa con información cualitativa. Puesto que el valor 
tiene la propiedad ordenada, esto puede inducir a pensar que existe algún orden 
en la variable representada (tipos de suelo en este caso). Además, y debido a que 
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el valor es disociativo, algunos elementos son más llamativos, lo que puede asociar 
una falsa preponderancia a la clase a la que representan. 

Razonamientos similares se pueden aplicar para el caso particular de capas con 
variables de tipo verdadero/falso. En estas, deben emplearse colores de similares 
características, de forma que no exista posibilidad de interpretarlos erróneamente y 
asociar a alguna de las opciones la idea de ser «mejor» que la contraria. Transmitir 
la información no es lo único que se busca, sino también hacerlo sin que aparezcan 
posibles sesgos a la hora de interpretarla. 



Zonas urbanas 
Bosques 


I Charcas 

I I Zonas agrícolas 


Figura 27.5: Uso incorrecto de la variable visual valor para representar información 
cualitativa. Puede transmitirse una falsa sensación de que existe un orden en las clases 
representadas. 


27.4.1. Creación y asignación de clases 

En el caso de trabajar con información de tipo intervalos o razones, simbolizar 
cada uno de los valores de una forma distinta supone la necesidad de emplear un nú- 
mero muy elevado de simbologías distintas. Esto puede complicar la interpretación 
del mapa, especialmente si se lee este junto a su leyenda correspondiente, ya que 
identificar una simbología concreta en esta es complejo y resulta fácil equivocarse. 
Asimismo, con un número elevado de simbologías, las diferencias entre estas son 
pequeñas, por lo que también es complicado separar unas de otras y percibir que dos 
de ellas son distintas o son la misma. Por esta razón, lo habitual es agrupar todo el 
conjunto de valores disponibles en una serie de categorías, clasificándolos y estable- 
ciendo la simbología no en función del valor en sí, sino de la clase a la que pertenece. 

La creación de clases para una serie de valores es un problema en el que han de 
considerarse dos parámetros principales: el número de clases a crear y el criterio 
a aplicar para establecer los límites de cada una. 
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Respecto al numero de clases, este debe ser lo suficientemente grande como 
para no resumir en exceso la información y poder mostrar con un cierto detalle el 
comportamiento de la variable, pero no demasiado alto para evitar los problemas 
que aparecían en el caso de no dividir los valores en clases. El número de clases es 
también función de la variable visual utilizada, ya que algunas resultan más fáciles 
de diferenciar. En general, el máximo de clases que se distinguen es del orden de 

7 u 8, no siendo recomendable establecer un número mayor, con independencia de 
qué variable empleemos. Esto no quiere decir que deban crearse sistemáticamente 

8 clases para cualquier variable y situación, ya que, en función de otros factores, 
puede resultar de interés elegir otro número distinto de clases. De nuevo, no debe 
perderse de vista la finalidad que va a tener el mapa que estamos diseñando. 

Una vez que hemos decidido el número de clases, debemos definir el rango 
de valores que cubrirá cada una de ellas. Esto debe llevarse a cabo tratando de 
maximizar la información que se transmite y de aprovechar lo mejor posible la 
variable visual empleada. Por ejemplo, si esta variable es la coordenada valor de 
un color, debemos tratar que aparezca bien distribuida y que todas las clases 
tengan un número similar de elementos, para que todos esos valores aparezcan 
representados en una cantidad similar a lo largo del mapa 1 . 

La conveniencia de usar una u otra definición de clases está, como resulta fácil 
deducir, ligada a la propia distribución de los valores de la variable, por lo que 
estudiar estos es fundamental. Un histograma es una herramienta muy útil para 
llevar esto a cabo. 

De entre los métodos que se emplean frecuentemente para la creación de clases 
de forma sistemática, cabe destacar los siguientes: 

■ Intervalos iguales. Simplemente se divide el rango cubierto por los valores 
en n clases de la misma amplitud, siendo esta igual a max ~ mm . Su principal 
inconveniente es que puede resultar en clases con muchos elementos y otras 
prácticamente vacías, en especial si la variable tiene una distribución normal 
o aparecen elementos con valores atípicos ( outliers ) , que desvirtúan el signifi- 
cado del máximo y el mínimo a la hora de calcular la amplitud de cada clase. 

■ Intervalos naturales. Basados en la propuesta de saltos naturales de Jenks 
[387], trata de establecer clases lo más homogéneas posibles, disminuyendo 
la varianza de cada clase. De este modo, se obtienen clases que presentan la 
máxima variabilidad entre ellas, constituyendo categorías bien diferenciadas 
unas de otras. 

■ Intervalos normales. De especial interés para el caso en que la variable 
presenta una distribución normal. Se toma la media de los valores y se crean 
los límites de cada clase sumando o restando a esta la desviación típica o 
un múltiplo de esta. 


1 Aunque en un ámbito distinto, si repasas el apartado 16.3.1 dedicado a la expansión de 
contraste en imágenes, encontrarás una idea similar a esta. 
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■ Intervalos por percentiles. Utilizando percentiles pueden crearse clases de 
tal modo que todas ellas contengan el mismo número de elementos. Por ejem- 
plo, los cuartiles dividirán el rango de valores en cuatro clases, cada una de ella 
con igual numero de elementos. En este caso, los límites de separación de clases 
se encontraran en los percentiles del 25, 50 y 75 por cien, respectivamente. 
Pueden aplicarse también los percentiles no sobre la variable que se repre- 
senta, sino sobre la superficie que ocupan sus distintos valores. Se tiene 
de este modo los percentiles de superficie , que crean n clases, todas ellas 
representadas en el mapa por una misma superficie. 

■ Intervalos en progresión. Pueden emplearse progresiones como la arit- 
mética o la geométrica para crear las clases, en caso de que los valores de la 
variable a representar muestren un comportamiento según alguna de estas 
progresiones. 

Una comparación visual del resultado de aplicar algunos de los métodos an- 
teriores se muestra en la figura 27.6 

Junto a lo anterior, pueden utilizarse transformaciones de los valores previas 
a su asignación a una clase, para después clasificar el valor transformado. Una 
transformación logarítmica es habitual para el caso de valores distribuidos irregu- 
larmente, con muchos de ellos en un rango dado y unos pocos en un rango alejado de 
este. Aplicando un logaritmo (generalmente de base 10), los valores transformados 
pueden mostrar, por ejemplo, una distribución normal, siendo entonces posible 
aplicarles una simbolización mediante intervalos normales. Vimos un ejemplo de 
esto en la figura 14.4. 

Aunque resulta práctico definir las clases utilizando alguna de las metodologías 
anteriores, pueden igualmente establecerse límites de clase arbitrariamente según 
se considere oportuno en función de la distribución de los valores. Por ejemplo, si 
existen saltos importantes en esta y quiere reseñarse este hecho, pueden incluirse 
explícitamente como límites de los intervalos. Asimismo, pueden incorporarse 
valores particulares que sean de importancia para la variable representada. Esto 
puede verse claramente en el ejemplo de la figura 27.7 

Para el caso mostrado, en el cual se representa la elevación, es interesante 
diferenciar los valores positivos (sobre el nivel del mar) de los negativos (zonas 
por debajo del nivel del mar y, especialmente, batimetría del fondo marino). El 
cero es un valor que puede o no aparecer de modo natural como límite de clase 
al analizar los datos de elevación, pero que se incorpora por su importancia. 

El mapa de la figura presenta además un caso particular por otras razones, ya 
que utiliza el color como variable ordenada, pese a que dijimos que normalmente no 
posee tal propiedad. No obstante, este es uno de esos casos en que sí existe un orden 
fácil de percibir, ya que los colores escogidos están pensados para ser identificados 
con distintas zonas altitudinales. Las zonas de batimetría se representan en tonos de 
azul, por lo que en ese tramo se está empleando realmente la componente del color 
que denominábamos valor. Para las restantes, se comienza en el verde (zonas bajas 
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i | 0-33.264 
□ 33.264 - 66.529 

■ 66.529 - 99.793 

■ 99.793- 133.058 



Intervalos ¡guales 


| | 0-1.360 

| | 1.748-7.105 

□ 9.137-20.528 
■ 133.058- 133.058 



Intervalos naturales 


[ | 0-80 
| | 85 - 198 

I | 199-458 
■ 475- 133.058 



Percentiles 


Figura 27.6: Comparación entre distintos esquemas para la creación de intervalos de clase. 


donde crece vegetación que es de ese color) , seguido del marrón (zonas altas sin 
vegetación) y después el blanco (zonas elevadas que se pueden asociar a nieve) . La di- 
visión en esos tramos se hace empleando el valor igualmente. Esta asociación de con- 
ceptos tan básica (y no necesariamente muy real, pero sí conocida y compartida por 
todo el mundo) permite crear un orden y capacitar a la variable visual color para em- 
plearse a la hora de representar una variable de tipo intervalo como es la elevación. 

La presencia del valor cero como punto que define dos mitades (elevaciones 
sobre el nivel del mar o por debajo de este) hace que los datos de elevación tengan, 
en lo que a su simbolización respecta, un esquema de tipo divergente. Este tipo de es- 
quemas aparecen cuando la variable presenta algún valor crítico con un significado 
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180’ 210' 240‘ 270‘ 300’ 330‘ 0' 30' 60' 90' 120" 150' 180' 



180' 210' 240' 270' 300' 330' 0' 30' 60' 90' 120' 150' 180' 


Figura 27.7: Los intervalos pueden incorporar valores de importancia para una 
determinada variable. En este caso, para la variable elevación resulta particularmente 
relevante el valor cero, que delimita el comienzo de las clases representadas en azul. 


particular, dividiendo el conjunto de valores en grupos que pueden considerarse in- 
dependientes. Es habitual emplear un color de valor bajo (esto es, un color claro) en 
las cercanías del punto crítico, y aumentar el valor a medida que nos acercamos a los 
extremos tanto por encima como por debajo de este punto. Cada mitad, a su vez, sue- 
le representarse con colores que presentan un fuerte contraste entre sí, para de este 
modo indicar que cada una de ellas representa una realidad bien distinta de la otra. 

Los esquemas no divergentes para variables cualitativas se dice que son de tipo 
secuencial. 

Debe reseñarse que, en el caso de establecer las clases en función de los datos, 
tal y como sucede al aplicar los métodos que hemos descrito, la simbolización 
no será adecuada para realizar comparaciones con otros mapas. Un mismo valor 
puede simbolizarse con colores distintos en sendos mapas, ya que la clase a la que 
pertenece depende del resto de valores en su conjunto, por lo que no tiene sentido 
una comparación visual. Por el contrario, si el intervalo se define sin considerar 
los valores particulares del conjunto representado (como en el mapa de elevaciones 
anterior), el mismo color en dos mapas sí que implica un mismo rango de valores, 
con lo que pueden efectuarse comparaciones. 

Si quieres experimentar con la definición de clases y la asignación de colores 
a estas, una herramienta de enorme valor es la que encontrarás en la pagina Web 
http : //www . colorbrewer . org. Úsala no solo para probar ahora todo lo explicado 
en este capítulo, sino también cuando tengas que crear tus propios mapas. Elegir un 
conjunto adecuado de colores y clases no es una tarea sencilla, y una herramienta 
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así puede aportar mucho valor a tus mapas si la empleas correctamente junto a 
las propias funcionalidades del SIG que estés utilizando. 


27.5. Elementos del mapa. Composición 

Un mapa no es solo una colección de gráficos que representan objetos o valores 
del mundo real a una escala dada, sino que para ser verdaderamente completo 
requiere completarse con otra serie de elementos adicionales. Es decir, el mapa 
en sí no es solo lo que se deriva de la representación de la información geográfica y 
su simbolización, sino un conjunto de elementos dispuestos de forma óptima, entre 
los cuales, eso sí, resulta de particular relevancia aquel que contiene la información 
geográfica como tal. 

Igual de importante que simbolizar correctamente la información geográfica 
es situar adecuadamente los distintos elementos del mapa, ya que estos están 
pensados también, al igual que la propia simbología, para facilitar la interpretación 
de la información y hacer esta más comprensible. 

Los siguientes son los elementos fundamentales que podemos emplear para 
componer un mapa (Figura 27.8): 



Mapa de ejemplo mostrando sus distintos elementos 


Población 

• 0-1.360 

• 1.748 - 5.622 

• 7.105- 13.389 
0 20.528 - 20.528 
£ 133.058- 133.058 


Figura 27.8: Ejemplo de mapa mostrando sus elementos más habituales. 
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■ Nombre o título. Imprescindible para conocer qué información muestra 
el mapa. 

■ Autor. La persona u organismo que ha creado el mapa debe aparecer 
indicada en algún punto de este. 

■ Otra información sobre el mapa. Por ejemplo, la relativa al sistema de 
referencia empleado o la fecha de su creación, entre otras. 

■ Canevás. El canevás nos indica dónde dentro de la superficie terrestre se 
encuentra aquello que el mapa representa, y provee la referencia geográfica 
para sus elementos. Asimismo, complementa a la escala para la estimación 
visual de distancias y medidas. Es más necesario en caso de escalas bajas, 
aunque se añade con independencia de la escala. 

■ Leyenda. Aunque se ha de tratar de utilizar una simbología lo más expresiva 
posible, no toda la información puede incorporarse en el mapa, y es necesario 
acompañarlo de una leyenda. Esta ha de ser también fácil de interpretar y lo 
más clara posible. Una leyenda demasiado extensa o de difícil comprensión 
probablemente nos indica que la simbología escogida es mejorable. 

La leyenda es un elemento difícil de crear, aunque los SIG normalmente presen- 
tan funcionalidades de creación automática de esta. No obstante, la calidad 
del resultado suele ser pobre, y es habitual que exista siempre la posibilidad 
de editarla manualmente con posterioridad para corregir sus deficiencias. 
Un error común es mostrar los valores exactos de los intervalos de clase, una 
precisión muchas veces innecesaria. Por ejemplo, para los mapas de la figura 
27.6, que representan la variable población, los límites de los intervalos no 
son en algunos casos valores enteros debido a la propia naturaleza del método 
empleado para crearlos, pero la población sí que ha de ser siempre expresada 
con un valor entero. Expresar el rango de cada clase con un numero amplio 
de decimales (tal y como las rutinas automatizadas del SIG suelen hacer) no 
resulta muy adecuado, por lo que deben sustituirse las cifras por las corres- 
pondientes redondeadas, sin que ello reste utilidad o exactitud a la leyenda. 
La leyenda y el mapa en sí forman un todo, por lo que no deben separarse 
mediante un cuadro, salvo en el caso en que el mapa cubra todo el área del 
lienzo y no sea fácil separar visualmente de forma clara ambos elementos. 

■ Norte. Aunque habitualmente se presupone la orientación Norte-Sur, no 
siempre ha de ocurrir así, y una aguja apuntando al norte o una rosa de los 
vientos sirve para aclarar la orientación del mapa. Es de reseñar que la orienta- 
ción no ha de ser constante para todos los puntos de un mapa, estando esto en 
relación con el tipo de sistema de coordenadas y la proyección empleada. Por 
ejemplo, en el mapa mundial de la figura 27.7, el Norte se sitúa hacia arriba de 
la hoja solo en el centro. Si nos encontramos en la parte izquierda del mapa la 
dirección del Norte no es la misma. El canevás, que contiene los paralelos y me- 
ridianos, será en este caso la referencia fiable en lo que a orientación respecta. 

■ Escala. La escala debe indicarse tanto de forma numérica como gráfica, de 
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modo que puedan realizarse cálculos y estimar visualmente distancias entre 
puntos dados del mapa. 

■ Localizador. Un localizador provee un elemento visual para situar el mapa 
en un contexto geográfico más amplio, de modo similar al canevás. Es de 
especial interés en el caso de series de mapas, para establecer la relación 
entre el presente y los restantes dentro de la misma serie. En este caso, el 
localizador sirve como mapa índice. 

■ Mapas de detalle. Cuando resulta necesario mostrar una cierta zona del ma- 
pa con mayor detalle y a una escala mayor, se puede incluir un mapa correspon- 
diente a esa zona como un enclavado dentro del mapa principal. Se debe seña- 
lar asimismo sobre este último la zona a la que corresponde el mapa de detalle. 

Aunque en un mapa en sentido clásico deben incorporarse todos o la gran ma- 
yoría de los anteriores elementos, cuando trabajamos con representaciones dentro 
de un SIG la situación es distinta y se puede prescindir de una buena parte de ellos. 
Por ejemplo, y dado el carácter menos persistente de la representación en pantalla, 
añadir el nombre del autor carece la mayoría de las veces de sentido. Información 
tal como la procedencia de los datos que estamos visualizando resulta de más 
interés que el autor del mapa, pero lo correcto es consultar esta en los propios datos, 
que deberían contenerla de algún modo (veremos más sobre esto en el capítulo 31). 

La escala es adecuado mostrarla de forma numérica, pero no en su versión 
gráfica, ya que dentro de un SIG encontramos herramientas que nos permiten 
medir con total precisión distancias y áreas, y una escala gráfica carece de utilidad 
en este contexto. Por su parte, el localizador es mejor que el canevás para definir 
el contexto, ya que muchas aplicaciones SIG incorporan incluso un localizador 
interactivo sobre el que puede operarse para cambiar el encuadre del mapa. 

En lo que respecta a la forma de disponer los elementos sobre el lienzo que un 
mapa conforma, la premisa fundamental es maximizar la claridad y aprovechar de la 
mejor forma posible el espacio disponible. La figura 27.9 muestra un claro ejemplo de 
cómo un adecuado uso del espacio en el mapa, evitando que existan zonas en blanco 
que no comunican ninguna información, mejora notablemente la calidad del mapa. 

Asimismo, es importante que el diseño del mapa recalque su propósito, haciendo 
énfasis en los aspectos más relevantes para cumplir este. 

Aunque el objetivo principal del diseño cartográfico es crear un mapa útil y 
no un mapa bonito, no cabe duda que una cierta preocupación por el aspecto 
estético es recomendable, ya que también contribuirá a una mejor interpretación 
de la información del mapa. Este es un aspecto subjetivo y con una componente 
principalmente artística, aunque también pueden aportarse algunos elementos 
metodológicos de carácter más sistemático. Uno de ellos utilizado frecuentemente 
es el empleo de la proporción áurea para dimensionar los elementos del mapa. 
Comenzando por las dimensiones del propio lienzo, puede aplicarse a las de los 
restantes componentes, tales como la leyenda en caso de estar situada en un cuadro 
aparte, o el cuadro que contiene el nombre del mapa y otra información adicional. 
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a) 


b) 




• 317.764 - 824.643 

• 1 . 051 . 235 - 1 . 660.855 

• 1 . 823 . 606 - 2 . 620.637 

• 3 . 019.560 - 5 . 302.689 

• 6 . 228 . 239 - 9 . 815.795 


Figura 27.9: Ejemplo de un aprovechamiento óptimo del espacio de un mapa (a) y un 
aprovechamiento incorrecto de este (b). 


Los conceptos que deben manejarse a la hora de elegir las características de los 
elementos del mapa y su emplazamiento derivan de la percepción visual, disciplina 
que ya vimos en el capítulo anterior. A continuación tienes algunas ideas adicionales 
sobre percepción visual que deben aplicarse a la composición de mapas. Si deseas 
ampliar estos conceptos, la referencia fundamental sobre percepción visual desde 
el punto de vista del arte es [388] . 

■ El documento cartográfico tiene dos centros. Un centro geométrico y uno 
óptico. Este último se sitúa por encima del geométrico, aproximadamente 
a un 5% de la altura total del documento. Los elementos del mapa se deben 
disponer alrededor del centro óptico. 

■ Los elementos en la parte superior del mapa tienen una mayor importancia, así 
como los situados en la parte izquierda. Es en estas zonas donde deben situarse 
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los elementos más importantes sobre los que se quiera centrar la atención. 

■ La atención del lector del mapa va desde la esquina superior izquierda hasta 
la inferior derecha, pasando por el centro óptico. Los elementos importantes 
deben situarse en esta línea, para que su posición se corresponda con los 
movimientos naturales de la vista. 

■ Debe tratarse de crear un mapa sea visualmente equilibrado. El equilibrio 
visual es el resultado del peso que cada elemento tiene y su posición, así 
como su orientación. Estos pesos deben repartirse adecuadamente por todo 
el lienzo del mapa. El peso de un elemento depende de múltiples factores, 
entre ellos los siguientes: 

• Posición. Los elementos tiene más peso en la derecha que en la izquier- 
da, y más en la parte superior que en la inferior. El peso aumenta al 
aumentar la distancia al centro del documento. 

• Tamaño. Mayor tamaño implica más peso. 

• Color. Los colores brillantes tienen más peso que los oscuros. El tono 
rojo tiene más peso que el azul. 

• Aislamiento. Los elementos aislados tienen más peso que aquellos ro- 
deados por otros. 

• Forma. Las formas regulares tienen más peso que las irregulares. Cuanto 
más compacta sea la forma, también tendrá más peso. 

• Dirección. Algunos elementos pueden tener una dirección que «dirija» 
la atención hacia otros, concediéndoles peso (por ejemplo, una flecha 
que señale a un elemento, haciendo que llame más la atención), 

Las ideas acerca de la composición y el equilibrio del mapa se han de aplicar 
a todo el documento cartográfico (es decir, al que contiene todos los elementos 
citados anteriormente) , así como a la parte de este que representa la información 
geográfica. Es importante seleccionar adecuadamente el área geográfica cubierta 
para que la información relevante que se muestra acerca de esta conforme un 
conjunto equilibrado y siga a su vez las indicaciones mencionadas. 

Recordar, por último, que la composición del mapa implica una organización 
horizontal (plana) de sus elementos, pero existe asimismo una organización ver- 
tical. Esta viene definida por la jerarquía existente, sobre la cual ya se comentaron 
algunas ideas en el apartado 26.5.2. Estas ideas deben aplicarse igualmente en la 
composición del mapa, para conjuntamente lograr un documento equilibrado en 
el que quede claro qué elementos son los de mayor importancia y pueda acceder se 
con facilidad a la información que contienen. 


27.6. Tipos de mapas temáticos 

Los mapas temáticos representan la mayor parte de los creados en un SIG, por 
lo que resulta necesario ver en detalle las formas en las que pueden presentarse. 
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Existen diversas alternativas en función del tipo de elemento que se pretenda 
simbolizar o las características de la variable tratada, y la elección de una u otra 
supondrá una diferencia importante en el mapa obtenido y en su uso posterior. 
En un mismo mapa pueden combinarse varias de estas formas, especialmente si 
se pretende representar más de una variable, en cuyo caso la combinación debe 
buscar la máxima claridad en la representación de todas ellas. 

En este apartado detallaremos los siguientes tipos de mapas temáticos: mapas 
de coropletas, mapas de isolíneas, mapas de densidad de puntos y mapas de sím- 
bolos proporcionales. Todos ellos se utilizan para la representación de variables 
cuantitativas. 

27.6.1. Mapas de símbolos proporcionales 

Un mapa de símbolos proporcionales representa variables cuantitativas a través 
de símbolos cuyo tamaño esta en relación con el valor a representar de dicha variable. 
Es decir, emplea la variable visual tamaño, que como ya hemos visto es la única que 
presenta la propiedad cuantitativa. La forma de los distintos símbolos es siempre la 
misma, y por simplicidad lo más frecuente es utilizar como símbolo base el círculo, 
aunque puede utilizarse cualquier otro, e incluso símbolos de tipo lineal (barras). 

Puesto que el tamaño es el elemento que diferencia a los distintos símbolos y 
el que transmite la información cuantitativa, su elección es crucial para la creación 
de un buen mapa de este tipo. La elección de un tamaño implica elegir uno mínimo 
y uno máximo, correspondientes a los valores mínimo y máximo de la variable en 
el mapa. Entre estos se situarán los distintos tamaños correspondientes al resto 
de posible valores que toma la variable. 

Existe, claramente, una relación entre el tamaño máximo y el mínimo, ya 
que se define una relación de escalado de los distintos valores. Este escalado es 
distinto para símbolos lineales que para símbolos de área, ya que la percepción 
de la relación entre ellos es distinto según el tipo de símbolo empleado. En ambos 
casos, el escalado debe ser coherente con el valor que se representa, de tal modo 
que si el usuario del mapa percibe que el tamaño de un símbolo es el doble que 
el de otro, los valores de ambos símbolos estén igualmente en esa proporción. 

Para conseguir esto se ha de seleccionar el tamaño asociado al valor de uno de 
los extremos. Esto se hará con un criterio puramente gráfico, de tal modo que, si 
por ejemplo establecemos el tamaño máximo, este no sea excesivo y a la hora de re- 
presentar el símbolo correspondiente en el mapa ocupe demasiado espacio y existan 
solapes. Debe evitarse asimismo que el tamaño mínimo sea demasiado pequeño y 
no se aprecie el símbolo con claridad. Una vez hecho esto, se establece una relación 
lineal, de tal forma que podemos calcular el tamaño correspondiente a todo valor. 
Si un valor de 100 se corresponde con una barra de una altura de lOnnn, entonces 
un valor de 200 se representara mediante una barra de 20mm, y así sucesivamente. 

Para el caso de símbolos superficiales, no obstante, el escalado no debe hacerse 
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en función de un parámetro lineal (por ejemplo, el radio en el caso de emplear 
círculos), sino respecto a la propia superficie. Es decir, si un valor de 100 se repre- 
senta con un circulo de radio r, el valor 200 no se representará mediante un círculo 
de radio r' = 2 r, sino con una de tal radio que la superficie sea el doble del primero. 
En este caso, el radio buscado sería r' = y/2 r. 

El escalado de símbolos se puede dar de forma continua, de tal modo que cada 
valor se representa con un símbolo de un tamaño calculado según la idea anterior, 
empleando el valor exacto para el escalado. No obstante, la capacidad de diferenciar 
visualmente tamaños distintos e interpretar la relación entre ellos es limitada, por 
lo que suele resultar más conveniente efectuar un escalado discreto. Es decir, crear 
clases y asignar a un valor no un símbolo del tamaño exacto que le correspondería, 
sino el asignado al valor que define a la clase, habitualmente el centro de esta. 

Tanto las barras como los círculos pueden sectorizarse, mostrando una división 
en subclases del valor total que representan. Para el caso de la población, podrían 
mostrarse las proporciones que corresponden a hombres y mujeres. Este tipo de 
representaciones, no obstante, son a veces difíciles de interpretar en su conjunto, 
por lo que resulta más adecuado crear varios mapas que muestren esa misma 
información por separado, en lugar de conjuntamente en uno único. 

Aunque la variable visual tamaño presenta la propiedad cuantitativa, la per- 
cepción de la relación de tamaño no es perfecta y existe una cierta imprecisión. 
Esta se debe a muchos factores, como por ejemplo el hecho de que los símbolos 
situados alrededor de uno dado pueden afectar a la percepción de su tamaño. Por 
esta razón, es importante para facilitar la correcta interpretación de un mapa de 
símbolos graduados el mostrar en la leyenda la relación entre los distintos tamaños 
de los símbolos y sus valores. Para el caso habitual de emplear círculos, esto puede 
llevarse a cabo mediante elementos gráficos como los mostrados en la figura 27.10 



Figura 27.10: Dos ejemplos de leyendas para un mapa de símbolos proporcionales. 

El uso de un escalado lineal en el que se conserve la propiedad cuantitativa resul- 
ta en ocasiones inapropiado debido a la distribución de los valores. Por ejemplo, para 
representar el mapa de la figura 27.6, este esquema no es adecuado, ya que una de las 
zonas presenta un valor de la variable muy superior a la del resto (puede verse esto 
claramente en la representación por intervalos iguales), lo cual requeriría el uso de 
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un símbolo desproporcionadamente grande. Si se usan clases iguales, la mayoría de 
los valores entrarían en una de ellas, por lo que no se transmitiría bien la distribución 
de estos. En este caso, se debe emplear un esquema de clases distinto, aunque así la 
proporción de tamaños no permita visualmente estimar las cantidades. Es decir, los 
tamaños de los símbolos nos indican que hay más cantidad en una zona que en otra, 
pero no podemos solo con ellos saber cuánto más hay. Los mapas elaborados de esta 
forma se conocen como mapa de símbolos graduados. En estos mapas, la importancia 
de la leyenda es aún mayor si cabe, ya que es la encargada de explicar el significado 
de cada tamaño, y sin ella la información de la que disponemos es mucho menor. 

El mapa de la figura 27.8, que mostramos al presentar los distintos elementos 
del mapa, es un ejemplo mapa de símbolos graduados. 

27.6.2. Mapas de puntos 

Los mapas de puntos se emplean especialmente para la representación de 
variables que representen algún tipo de cantidad, tales como la población, el gasto 
medio por persona o la producción de un determinado cultivo. Estas cantidades 
se representan mediante la repetición de puntos, en numero proporcional a su 
magnitud. Cada uno de esos puntos representa un valor unitario, y el conjunto 
de ellos sobre la zona en cuestión suma la cantidad total a representar. Los puntos 
tienen todos la misma forma y tamaño, a diferencia de lo que vimos en el caso de 
los símbolos proporcionales. 

Los mapas de puntos transmiten de forma muy eficaz los valores que represen- 
tan, obteniéndose este por el mero recuento, aunque visualmente permiten una 
estimación inmediata y pueden compararse entre las distintas zonas del mapa. Por 
esta razón, son especialmente adecuados para variables discretas más que para 
continuas, aunque también pueden emplearse para estas últimas. 

Aunque podrían crearse con cualquier otro símbolo, ya que es la repetición de 
este la que transmite la información, lo más habitual es el empleo de puntos, de 
ahí el nombre genérico que se les da. 

Tres son los aspectos que deben tenerse en cuenta a la hora de elaborar un 
mapa de puntos: el valor de cada punto (es decir, cuántas unidades de la variable 
representa cada punto), su tamaño y su posición. 

Si los valores de la variable que se manejan son bajos, se puede establecer como 
valor del punto la unidad. Es decir, un punto representa sobre el mapa un habitante 
en el caso de un mapa de población. No obstante, con valores altos (como en el caso de 
la población) esto da lugar a un número demasiado elevado de puntos que saturan el 
espacio del mapa y no transmiten adecuadamente la información. Por ello, cada pun- 
to debe representar un número mayor de elementos de la variable representada, de 
tal modo que no aparezcan en demasía en el mapa, solapándose unos con otros. Si el 
valor escogido es demasiado alto, aparecerán pocos puntos en el mapa, y este puede 
quedar poco expresivo y no transmitir la distribución de la variable. Debe, por tanto, 
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escogerse un valor adecuado que equilibre la presentación de los puntos sobre el ma- 
pa. Este valor se representará en la leyenda para su interpretación, habitualmente en 
forma de texto, escribiendo por ejemplo, que «un punto equivale a 1000 habitantes» . 

La elección del tamaño del punto debe garantizar la buena visibilidad de este, al 
tiempo que no debe ser excesivamente grande para que no ocupe demasiado espacio 
y dificulte la visión de otros. Obviamente, el tamaño óptimo está en relación con 
el valor unitario escogido, y ambos parámetros deben establecerse conjuntamente 
para lograr la combinación más adecuada. 

Por último, la posición del punto es de gran importancia para transmitir la in- 
formación correcta y no dar lugar ambigüedades o incorporar errores conceptuales. 
Si no disponemos de información adicional y solo tenemos el valor correspondiente 
a una zona dada, los puntos se han de disponer de forma regular ocupando toda la 
superficie de la zona. Si, por el contrario, sabemos algo más acerca de la distribu- 
ción de la variable, debemos emplear esa información para emplazarlos de forma 
más realista. Si, por ejemplo, la zona corresponde a una provincia y sabemos la 
localización de la principal ciudad dentro de ella, es más lógico situar más puntos 
cerca del emplazamiento de esa ciudad que en otras partes de la provincia, ya que 
una mayor parte de la población estará allí. 

Otro aspecto a considerar es el significado de la variable que se representa y la 
posibilidad o no de que aparezca en las distintas localizaciones de los puntos. Si la 
variable es, por ejemplo, el numero de ejemplares avistados de un determinado ave 
acuática, situar los puntos sobre zonas urbanas o de bosque no tiene sentido, ya 
que dan a entender que ahí hay presencia de esa especie (tantos ejemplares como 
los puntos en cuestión indiquen), algo que es falso. 

En los dos casos anteriores va a resultar necesario «mover» los puntos a su 
localización más correcta, algo que, habitualmente, no resulta posible con los 
mecanismos automatizados de que dispone un SIG. El chequeo del mapa creado 
resulta, por tanto, imprescindible para comprobar que existen puntos en posiciones 
erróneas. El uso de herramientas externas tales como programas de diseño gráfico, 
según vimos en el capítulo 25, es una solución para retocar los mapas creados y 
obtener una distribución de los puntos más correcta. 

La imagen 27.11 muestra un ejemplo de un mapa de puntos. 

27.6.3. Mapas de isolíneas 

Los mapas de isolíneas son unos de los más usados para la representación de 
información cuantitativa, en particular cuando se trata de variables continuas. Se 
utiliza habitualmente para representar campos escalares y constituye una forma 
muy efectiva de incorporar esta información en un mapa, ya que puede combinarse 
con otros tipos de mapas y de información, debido a que, al representarse única- 
mente mediante líneas, permite la presencia de otros elementos dentro del mapa 
sin resultar obstrusiva. 
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Un mapa de isolíneas está formado por un conjunto de líneas, cada una de 
las cuales une puntos que presentan el mismo valor de la variable. Estas líneas 
no pueden cruzarse, ya que ello significaría que en un punto se presentan dos 
valores. El caso más típico de mapa de isolíneas son las curvas de nivel que aparecen 
el un mapa topográfico, indicando la elevación del terreno. Otras variables que 
habitualmente se representan mediante curvas de nivel son la temperatura (en 
cuyo caso, las líneas se denominan isotermas ), la presión ( isóbaras ) o el tiempo 
( isócronas ). En el caso de las curvas de elevación, estas se conocen como isohipsas, 
aunque resulta mucho más habitual denominarlas simplemente curvas de nivel, 
nombre que se emplea también por extensión como sinónimo general de isolíneas. 

Para una variable continua, los valores que esta puede tomar son infinitos, por lo 
que el número de isolíneas que pueden trazarse también lo es. Por ello, es necesario se- 
leccionar qué isolíneas se desea representar, estableciendo clases y representando tan 
solo los límites de estas. A pesar de esta división, no resulta habitual un análisis com- 
plejo a la hora de establecer la distintas clases, tal y como se detalló en el apartado 
27.4.1. En su lugar, se emplean en la gran mayoría de casos intervalos iguales, siendo 
el tamaño de cada clase (el rango de valores que cubre) el único parámetro a definir. 
Este parámetro es lo que se conoce como equidistancia en un mapa de curvas de nivel. 

La construcción de un mapa de curvas de nivel es una tarea compleja que requiere 
de unas técnicas particulares que no detallaremos aquí. La razón para esto es que, 
dentro de un SIG, esas técnicas se aplican de forma distinta a través de procesos 
como los que ya hemos visto en la parte correspondiente del libro. El problema 
principal para la construcción del mapa de isolíneas es estimar el trazado de estas 
a partir de valores puntuales, lo cual coincide con lo que vimos en el capítulo 13 
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acerca de los distintos métodos de interpolación. Por esta razón, dentro de un SIG el 
procedimiento a seguir será calcular una capa ráster a partir de valores puntuales, y 
después crear las isolíneas a partir de esta capa según lo visto en el apartado 17.3, no 
siguiendo la metodología clásica de creación de estas a pesar de que los fundamentos 
teóricos subyacentes (las técnicas de interpolación) son los mismos en ambos casos. 

Algo que si debe citarse en lo que respecta a la creación de las isolíneas, ya 
sea con o sin la ayuda del SIG, es la diferencia entre las denominadas isaritmas 
o líneas isométricas y las isopletas. Las isartimas expresan una variable que existe 
como tal en aquellos puntos por los que pasa la isolínea, como por ejemplo en el 
caso de la elevación. Una curva de nivel de 100 metros pasa por un punto en el 
que la elevación es exactamente igual a 100. Con otras variables, sin embargo, el 
valor no tiene que existir como tal en esos puntos, y la isolínea es solo una forma de 
representar el comportamiento de la variable. Así sucede, por ejemplo, en valores 
que no ocurren en puntos, sino por unidad de área, y que al convertir en isolíneas 
dan lugar a las citadas isopletas. 

Imaginemos, por ejemplo, el caso de la densidad de población. Podemos crear 
unas isolíneas de densidad de población, pero no podemos medir esta en un punto. 
Debemos contar los habitantes en un área dada y después dividir entre dicho área. 
El valor obtenido debemos después asignarlo a un punto y con el conjunto de 
puntos así obtenidos ya podremos crear las isolínea. La diferencia en este caso es 
que esa unidad de área debe resumirse en un punto. 

En caso de que dentro de la unidad exista una distribución homogénea, pode- 
mos asignar el valor del área a su centro geométrico, pero de no ser así es necesario 
buscar otra localización en base a la información adicional de que dispongamos. Por 
ello, los mapas de isopletas presentan mayor incertidumbre que los de isaritmas, 
especialmente si las unidades de área empleadas son grandes. Aunque a efectos de 
su representación (que es principalmente lo que estamos tratando en este capítulo) 
no existen diferencias, los aspectos que deben tenerse en cuenta a la hora de su 
uso y creación son distintos y deben reseñarse. 

A la hora de simbolizar las isolíneas, y con independencia de su tipo, la variable 
visual tamaño es la única que suele emplearse, en particular para señalar aquellas 
líneas que representan un valor múltiplo de una determinada cantidad y hacer 
así más fácil la lectura del mapa. Estas líneas son lo que se conoce como curvas 
directrices. Por ejemplo, en un mapa topográfico con curvas de nivel con una equi- 
distancia de 100 metros, es habitual establecer curvas directrices cada 500 metros. 
Todas aquellas curvas cuyo valor asociado sea múltiplo de 500 se representan con 
un trazo más grueso para que puedan localizarse rápidamente. 

El uso del color o la textura en las líneas no es habitual como simbología, ya que 
simbolizar los valores de cada una través de las variables visuales resulta en este 
caso menos práctico. Lo normal es etiquetar cada una de ellas con el valor concreto 
(con texto sobre la línea) , y aprovechar el hecho de que dos líneas consecutivas están 
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Figura 27.12: Mapa de isolíneas. Se ha empleado para su representación tanto las líneas 
como el coloreado de las franjas entre estas. 


separadas siempre una magnitud igual al tamaño de la clase (la equidistancia) , 
lo cual aporta un importante contexto en lo que a los valores se refiere. 

Una forma particular de representar las isolíneas mediante color es hacerlo no 
sobre las líneas, sino sobre las zonas que median entre ellas. Es decir, representar 
la clase en lugar del límite de clase. Este tipo de mapas se asemeja al mapa de 
coropletas (que veremos seguidamente) , tratándose más de un mapa de áreas que de 
líneas, por lo que se conoce como de isocoropletas. Ambos tipos de representación, 
mediante áreas y mediante líneas, pueden combinarse en un único mapa. 

En la figura 27.12 puede verse un ejemplo de mapa de isolíneas combinando 
las dos formas anteriores. 

27.6.4. Mapas de coropletas 

Los mapas de coropletas son utilizados muy habitualmente para representar la 
información geográfica en un SIG, y hemos visto ejemplos de ellos en otros puntos 
de este y otros capítulos. Por ejemplo, los mapas de la figura 27.6 son todos ellos 
mapas de coropletas. 

En un mapa de coropletas se tiene una serie de áreas definidas, cada una de 
las cuales posee un valor de una variable. Este valor de la variable afecta a todo el 
área y es el que se representa por medio de alguna variable visual, normalmente el 
color a través de su componente valor. Las zonas definidas por cada área tienen un 
significado arbitrario, no relacionado con la variable asociada. Muy frecuentemente, 
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se utilizan limites administrativos o de gestión como áreas. Cada área conforma una 
unidad espacial, y el valor asociado a ella resume la variable dentro de dicho área. 

Precisamente por esta generalización que se da al representar mediante un 
único valor la variable dentro de cada unidad, los mapas de coropletas adolecen 
de ciertos inconvenientes, siendo los dos siguientes los principales: 

■ Sensación de cambio brusco en los límites entre áreas. Al existir una 
transición abrupta entre unidades, un mapa de coropletas puede transmitir 
la idea de que en esa frontera los valores de la variable cambian bruscamente, 
ocultando la continuidad de la variable en caso de existir esta. 

■ Homogeneidad dentro de cada área. La variación dentro de cada área 
no se recoge, con lo que se pierde una parte de la información. El uso de 
unidades menores soluciona en parte este problema, aunque puede hacer 
el mapa más complejo de interpretar y puede desvirtuar la información 
(recordemos aquí todo lo que vimos en el capítulo 10 y los conceptos tales 
como el Problema de la Unidad de Área Modificable). Al mismo tiempo, las 
unidades pueden tener su significado particular, como por ejemplo tratarse 
de divisiones administrativas, con lo que el uso de otras distintas altera la 
información que se pretende transmitir. 

Igualmente, debe considerarse que, en el caso de valores no normalizados, las 
coropletas pueden transmitir una información equivocada. Por ejemplo, si una varia- 
ble representa un conteo, tal y como la población de un conjunto de estados, el uso de 
coropletas no tiene en cuenta la superficie de cada una de las áreas representadas. Un 
mismo valor en dos unidades, una de ellas con una superficie mucho mayor a la otra, 
puede dar la sensación de que poblacionalmente ambas zonas son similares, mientras 
que puede ser que una tenga una gran densidad de población y la otra esté práctica- 
mente despoblada. El valor que simbolizamos sí está relacionado con el área (a mayor 
área, encontraremos más habitantes), y sería más adecuado representar esa densi- 
dad de población, ya que resulta menos proclive a inducir una interpretación errónea. 
En general, el uso de coropletas es correcto cuando la variable ha sido normalizada, 
por ejemplo dividiendo el valor numérico de cada unidad entre la superficie de esta. 

En los mapas de coropletas cobra especial importancia la correcta división de 
clases según hemos detallado dentro de este mismo capítulo. De entre las variables 
visuales, el color es la usada en la gran mayoría de casos, en particular utilizando 
su componente valor, y las propias características de las coropletas, en particular 
las desventajas que ya hemos mencionado, han de considerarse a la hora establecer 
cómo hacemos uso de esta variable visual para la simbolización de cada unidad. 

Así, debemos tener en cuenta que a la hora de distinguir dos colores con el 
mismo tono y distinto valor, si estos son muy semejantes solo resulta posible dife- 
renciarlos cuando se sitúan el uno junto al otro, pero no cuando están separados y 
median entre ellos otros colores distintos. Aunque la variable con la que trabajemos 
sea continua, el mapa de coropletas no ha de exhibir dicha continuidad, por lo 
que no podemos contar con ella para elaborar la rampa de valores correspondiente. 
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Mientras que en un mapa de isolíneas sabemos que los distintos colores van a 
aparecer de forma ordenada (en el mismo orden en el que se muestran en la leyenda) , 
en el mapa de coropletas una unidad puede tener a su lado otra con un valor muy 
distinto sin que entre ellas exista una de valor intermedio, pudiendo producirse un 
salto de varias clases. Esto tiene como consecuencia que el número de clases que 
podemos emplear es menor que al trabajar con isolíneas, ya que esta separación 
espacial que puede aparecer en las distintas clases va a dificultar su diferenciación. 

De igual modo el uso del tono queda más restringido, al poder dar lugar a 
situaciones ambiguas. Por ejemplo, si miramos la leyenda del mapa de la figura 27.7 
veremos que hay dos clases con un tono blanco. Por una parte, los valores situados 
cerca del cero (al nivel del mar). Por otro, los situados en la parte superior de la 
escala, es decir, los que corresponden a mayor elevación. Esto no da lugar a ambi- 
güedad, ya que el primer caso siempre aparecerá cerca de tonos azules, mientras que 
el segundo se situará cerca de los marrones. No puede ser de otro modo, ya que equi- 
valdría a que las curvas de nivel pudieran cortarse entre sí, lo cual sabemos que no es 
posible. El contexto de los colores circundantes sirve para eliminar la ambigüedad. 
En el mapa de coropletas, al no suceder necesariamente así, la ambigüedad perma- 
necería y haría imposible discernir el significado de la simbología. En el caso de las 
isocoropletas, en la que la contigüidad espacial sí implica también contigüidad de 
clases, sí pueden utilizarse este tipo de esquemas, como ya vimos en la figura 27.12. 

Por todo lo anterior, el uso de la componente valor es preferible frente al uso 
del tono a la hora de crear un mapa de coropletas para representar información 
cuantitativa. 

27.6.5. Otros tipos de mapas 

Existen muchos otros tipos de mapas, adecuados para representar tipos par- 
ticulares de información. A pesar de su utilidad, son mucho menos frecuentes, 
especialmente dentro del ámbito SIG, ya que su implementación no es habitual y 
no resulta común crearlos con las herramientas usuales de estos. Algunos de estos 
tipos de mapas que resulta de interés reseñar son los siguientes: 

■ Mapas dasimét ricos. Los mapas dasimétricos tratan de evitar las deficien- 
cias de los mapas de coropletas, en los que los límites de las distintas áreas 
representadas no tienen relación con la variable con la que se trabaja, siendo 
limites arbitrarios tales como divisiones administrativas o territoriales. En 
los mapas dasimétricos las divisiones obedecen a la propia geografía de la va- 
riable. El principal inconveniente de estos mapas es el mayor esfuerzo que su 
preparación exige, así como el mayor conocimiento de la variable que resulta 
necesario para poder definir las distintas zonas del mapa. Tradicionalmente 
se han empleado para representar la densidad de población, siendo poco 
usados para otras variables. 

■ Mapas de flujo. Los mapas de flujos representan movimientos de algún 
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tipo de elemento, como por ejemplo las exportaciones de un producto o los 
desplazamientos de tropas en una campaña militar. El mapa de flujo aporta 
información sobre cómo se produce la distribución del elemento que se despla- 
za, la proporción o magnitud en que lo hace, así como también la ruta seguida, 
aunque este último factor no es habitualmente prioritario y suele representar 
más con carácter esquemático (indicando la relación entre los puntos de par- 
tida y destino del movimiento) que como verdadera información geográfica 
sobre el trayecto en cuestión. Algunos de los mejores ejemplos de mapas de flu- 
jo son los creados por Charles Joseph Minard (1781-1870), ingeniero francés 
pionero en su creación. Uno de esos mapas puede verse en la figura 27.13. 



Figura 27.13: Mapa de flujo de Charles Joseph Minard sobre la campaña de Napoleón 
en Rusia. 


■ Cartogramas. En los cartogramas, la información cualitativa se transmite 
mediante la modificación de las unidades de superficie, que se distorsionan 
para representar con su tamaño la magnitud de la variable en cuestión. Es 
decir, la variable visual tamaño se aplica directamente sobre las distintas 
unidades de superficie. En la figura 27.14 puede verse un ejemplo de carto- 
grama en el que los países de la unión europea se representan de tal modo 
que su tamaño es proporcional a su población. La densidad de población 
se incorpora mediante el tono en que se representa cada uno de esos países. 
Aquellos países con una mayor densidad de población son los que sufren más 
distorsión en la representación de sus contornos. 
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Figura 27.14: Un ejemplo de cartograma (Adaptado de Wikipedia). 


27.7. Resumen 

Hemos visto en este capítulo cómo un mapa constituye una forma de comu- 
nicación visual, y cómo en esa comunicación existen una serie de factores a tener 
en cuenta para que la transmisión de la información entre emisor y receptor sea 
óptima. De especial relevancia en este sentido es prestar atención a este último 
y tener siempre en cuenta el propósito del mapa que creamos. 

Distinguimos dos tipos de cartografía: la cartografía de base y la temática. Esta 
última es la que crearemos con más frecuencia en un SIG. Las formas de cartografía 
temática están muy relacionadas con las características de la variable. Para el caso 
de variables cuantitativas, es importante agrupar adecuadamente los distintos 
valores en clases. Existen diversas formas de delimitar los intervalos correspon- 
dientes, siendo las más habituales el uso de intervalos iguales, intervalos naturales 
o intervalos basados en la media y la desviación típica de los valores en cuestión. 

Dentro de los tipos de mapas temáticos más importantes encontramos los 
mapas de puntos, de símbolos proporcionales, de isolíneas y de coropletas, cada 
uno de ellos con sus características particulares. Los mapas de isolíneas son espe- 
cialmente indicados para la representación de variables continuas, mientras que 
por su parte las variables de tipo razones se representan de forma especialmente 
adecuada mediante los mapas de puntos. 

A la hora de componer un mapa existen diversos elementos que deben aña- 
dirse para facilitar su interpretación. Además de conocer la función de cada uno, 


es importante saber cómo situar estos sobre el lienzo del mapa, aprovechando 
correctamente el espacio e integrándolos adecuadamente. 



Capítulo 28 


La visualización en términos SIG 


Ahora que ya conocemos la teoría del diseño cartográfico y sus ideas principales, es 
momento de aplicar esto a los SIG y ver en qué medida un SIG nos permite aplicar esas ideas. 
El objetivo de este capítulo es facilitar la aplicación de todo lo visto en los anteriores, para 
mejorar así nuestro trabajo con un SIG. Se trata de un capítulo eminentemente práctico en 
el que veremos la visualización no desde un punto de vista conceptual, sino directamente 
sobre el SIG, y aprenderemos cómo usar este para lograr crear mejores mapas y, en general, 
mejores visualizaciones de todo tipo de datos susceptibles de ser incorporados en un SIG. 


28.1. Introducción 

El SIG es nuestro útil para visualizar la información geográfica y, como hemos 
visto, un útil muy potente y con numerosas posibilidades. Conocemos ya sus 
capacidades y limitaciones, pero no sabemos todavía cómo debemos trabajar con 
estas a la hora de crear una representación visual y, sobre todo, desconocemos la 
forma en que las particularidades de la información geográfica dentro de un SIG 
afectan a su visualización. 

El concepto de capa, que resulta vital para otras tareas tales como el análisis, 
va a tener de igual modo una influencia directa en la creación de representaciones a 
partir de los datos de que disponemos, ya que la interpretación de estos datos está 
condicionada inevitablemente al modelo de datos empleado. Por ello, veremos en 
este capítulo los conceptos que ya conocemos de otros anteriores, pero aplicados 
al caso particular de aplicarlos dentro de un SIG, empleando las herramientas que 
este habitualmente incluye para esa tarea. 

Puesto que conocemos ya un buen conjunto de operaciones sobre los datos 
espaciales, y estas operaciones forman parte integrante del SIG al igual que la vi- 
sualización, estudiaremos asimismo cómo aprovechar algunas de estas operaciones 
de cara a la visualización de información geográfica. Es aquí donde reside una de 
las grandes virtudes del SIG, en que sus distintas capacidades están conectadas 
y son accesibles desde un mismo entorno. Hacer más patente esa relación entre 
ellas y ampliar así las posibilidades que un mismo juego de datos ofrece para ser 
representado es uno de los objetivos de este capítulo. 

En conjunto, las capacidades que ofrece un SIG, incluso si en muchos casos no al- 
canzan la funcionalidad necesaria para satisfacer al cartógrafo profesional, permiten 
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expandir las posibilidades de representación de una capa cualquiera y obtener vi- 
sualizaciones distintas a las que son habituales en un mapa clásico. Del mismo modo 
que una aplicación C AD amplía las posibilidades del arquitecto o ingeniero a la hora 
de crear planos o realizar diseños industriales, o un programa de animación abre 
nuevos horizontes para un dibujante, los SIG expanden las posibilidad de creación y 
uso de cartografía para todo aquel que requiera visualizar la información geográfica. 

Cuando la información geográfica se presenta en pantalla y dentro del contexto 
de la aplicación SIG correspondiente, lleva asociada además una interactividad de 
la que un mapa impreso carece, circunstancia que también debe tenerse en cuenta. 
Así, junto a las ideas básicas que ya hemos desarrollado en otros puntos dentro 
de esta parte del libro, es necesario añadir algunas adicionales para cubrir toda 
la gama de posibles resultados visuales que ahora encontramos gracias a los SIG. 

Además de esa representación habitual de capas que constituye la adaptación 
de la cartografía clásica al entorno de un SIG, otras formas de visualización que 
encontramos en estos son novedosas y no tienen un equivalente en aquella. Aunque 
su relevancia es variable, algunas de ellas representan una parte importante de las 
funcionalidades actuales de los SIG, por lo que las trataremos por separado para 
ver cómo complementan a las herramientas de visualización habituales y cómo 
se integran con estas. 


28.2. Visualización de capas vectoriales 

La visualización de capas vectoriales en el seno de un SIG es similar a la labor 
de la cartografía clásica, en cuanto a que los objetos que se representan son del 
mismo tipo, esto es, objetos geométricos en forma de puntos, líneas y polígonos. 
A diferencia de las capas ráster, que no tienen un equivalente en un mapa clásico 
(no es probable que hayas visto un mapa previo a la aparición de los SIG con un 
aspecto como las imágenes de, por ejemplo, la figura 28.3), las capas vectoriales 
guardan mucha similitud con los elementos que un cartógrafo clásico plasma en 
un mapa. Las geometrías de las capas vectoriales son los objetos básicos sobre los 
que el cartógrafo aplica las variables visuales según vimos en el capítulo 26, y por 
tanto la manera de proceder es similar. Las herramientas que el SIG proporcio- 
na son aquellas que permiten modificar las variables visuales en función de las 
características asociadas a cada geometría a representar. 

Un papel destacado en la visualización lo juega la tabla de atributos, ya que es 
la que contiene esas características que son necesarias para saber cómo representar 
cada objeto. El SIG provee la conexión entre los valores de los atributos y la 
representación visual, de forma que se interpretan aquellos para poder obtener 
los distintos tipos de mapas que ya conocemos del capítulo 27. 

Al igual que el tipo de información es importante para escoger el tipo de mapa 
a crear o la variable visual a emplear para la representación, el tipo de datos ha de 
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estar correctamente definido en la tabla de atributos para poder emplearse como 
tal. Es decir, ha de ser coherente con la información que recoge. 

Los atributos pueden contener en ocasiones no un valor que al interpretarse se 
convierta en una cualidad dada de una variable visual, sino esa cualidad directamen- 
te. En el caso de capas procedentes de aplicaciones CAD, es habitual que estas con- 
tengan algún campo con el color que ha de emplearse para representar esa capa, que 
puede venir indicado como un código que se deberá transformar después en el color 
correspondiente, o bien expresado directamente como el valor RGB de dicho color. 

Respecto a las geometrías, es interesante hacer ver que, aunque los objetos geo- 
métricos que se representan son del mismo tipo que los objetos con los que trabaja 
el cartógrafo clásico, no ha de existir siempre obligatoriamente una identificación 
directa entre ambos. En otras palabras, el cartógrafo puede pintar un conjunto de 
líneas no mediante una línea sino como un conjunto de polígonos entre líneas, tal y 
como sucede en el mapa de isolíneas de la figura 27.12. Tanto el cartógrafo clásico 
como su equivalente moderno que emplea un SIG parten los dos de un conjunto 
de líneas, pero su forma de operar es distinta. 

En un mapa clásico, se trazan las líneas y después se rellena con los colores co- 
rrespondientes. En el SIG, no existe la posibilidad de «rellenar», ya que únicamente 
pueden aplicarse las variables visuales a las entidades, y el espacio intermedio entre 
líneas no es ninguna entidad que tengamos almacenada en la capa. No obstante, 
crear esa representación resulta perfectamente posible en un SIG, aunque con un 
planteamiento distinto. 

Puesto que queremos representar objetos de superficie, necesitamos una capa de 
polígonos. Obtener esta no debiera resultarnos complicado si conocemos las rutinas 
que vimos en la parte de procesos, que permiten convertir capas vectoriales en capas 
ráster, y viceversa. Podríamos, por ejemplo, rasterizar la capa de líneas, aplicar una 
reclasificación de sus valores para que queden en clases de la misma amplitud que 
la equidistancia de las isolíneas, y después vectorizar esas clases para obtener los 
polígonos que ya podríamos representar y colorear adecuadamente. Más adecuado 
es, no obstante, representar directamente la capa ráster así obtenida, sin necesidad 
siquiera de reclasificarla, ya que las clases las aplicaríamos en la visualización 
directamente. Esa es la metodología empleada para obtener la representación de la 
figura 27.12, cuyo resultado, como puede verse, es visualmente muy satisfactorio. 

Conviven en la representación tanto una capa ráster como una vectorial. Lo 
relevante de este hecho es darse cuenta de las posibilidades que el SIG nos ofrece 
con sus funciones de análisis y mediante los procesos que hemos visto en una parte 
anterior del libro, y que pueden emplearse de igual modo para elaborar repre- 
sentaciones distintas. Ello aporta al SIG una flexibilidad que ha de aprovecharse 
cuando las capacidades de representación puramente dichas no nos ofrezcan la 
funcionalidad que necesitamos. 
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28.2.1. Etiquetado 

El etiquetado representa una de las tareas más complejas a la hora de crear 
un mapa, ya sea con la ayuda de un SIG o sin ella, estimándose que puede llevar 
aproximadamente un 50% del tiempo total de creación de un documento cartográ- 
fico [389]. La experiencia del buen cartógrafo queda patente en su trabajo con las 
etiquetas, pues es en esta labor donde más necesaria se demuestra, y en la que el cri- 
terio personal cobra una mayor importancia. Siendo así, es lógico pensar que este es 
asimismo uno de los procesos en los que más difícil resulta proveer una solución au- 
tomatizada, ya que trasladar al ordenador ese buen hacer del cartógrafo profesional 
no es en absoluto sencillo. Por ello, aunque un SIG puede incorporar herramientas 
para ayudar en el etiquetado, una gran parte de este trabajo sigue siendo necesario 
realizarla manualmente, y es por esta razón que conocer algunas ideas básicas al 
respecto es básico si queremos elaborar cartografía de una cierta calidad, ya que 
el SIG por sí mismo no va a poder llevar a cabo esta tarea de forma automática. 

En esta sección vamos a ver algunas ideas sobre etiquetado como parte de la 
visualización de capas vectoriales, ya que es en estas en las que verdaderamente 
tiene sentido esta labor. 

La premisa fundamental del etiquetado es situar las etiquetas de tal modo que 
estas no se solapen y que sea inmediato asociar su nombre al objeto geográfico que 
designan, así como a la importancia y propiedades de este. Para ello, necesitamos 
tres tipos de información a extraer de esos objetos: 

■ Dónde situar la etiqueta. 

■ Qué poner en la etiqueta. 

■ Cómo ponerlo. 

Tratándose de capas vectoriales, toda esta información la extraeremos tanto 
de la geometría como de la tabla de atributos asociada. La más obvia es la relativa 
a qué debe ponerse en la etiqueta, que simplemente se tomará de alguno de los 
campos de la tabla que contenga los nombres de los distintos objetos. 

Respecto a la posición, esta vendrá definida por la geometría y su georrefe- 
renciación, aunque solo parcialmente. La geometría nos da una indicación de la 
zona aproximada en la que debe situarse la etiqueta, ya que obviamente esta 
debe encontrarse a cerca del objeto al que hace referencia, pero no constituye una 
información suficiente, al menos para obtener un etiquetado óptimo más allá de 
la configuración más trivial. 

Por ejemplo, en el caso de puntos cercanos, situar la etiqueta de estos centrada 
exactamente en cada uno de ellos hará que se solapen y oculten además a los propios 
puntos. Es necesario colocarlas cada una de ellas alejadas de los puntos en direccio- 
nes contrarias, para que no interfieran entre sí. La localización por tanto, no depende 
únicamente de las coordenadas del objeto, sino también de las de los objetos circun- 
dantes. Buscar una disposición que evite estos solapes es una tarea en apariencia 
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simple, pero compleja desde el punto de su implementación 1 . Aun así, está presente 
en los SIG en mayor o menor medida, y en el caso de puntos, los resultados que se 
obtienen son de una calidad aceptable. El paso a otro tipo de geometrías, donde es 
necesario considerar otra serie de parámetros, hace aparecer unas circunstancias 
más difíciles de tratar, y la labor directa del cartógrafo es mucho más necesaria. 

En el caso de capas de líneas, la posición de las etiquetas debe seguir el trazado 
de las líneas y su orientación, existiendo, no obstante, diversas opciones en lo 
que respecta a la posición con respecto a la propia línea. La línea ya no es un 
objeto puntual y no existe por tanto una coordenada única que utilizar. El punto 
medio de la línea es la solución más inmediata como punto de referencia, pero 
no necesariamente la mejor. Pueden existir otras zonas a lo largo de la línea que 
resulten más relevantes y en las que sea más adecuado situar la etiqueta. En el 
caso de líneas muy largas, es conveniente repetir el nombre varias veces a lo largo 
de esta, para que no sea necesario seguirla hasta encontrar su nombre. 

En el caso de líneas que se entrecruzan (calles, ríos, etc.), es importante evitar 
las ambigüedades. No es conveniente etiquetar una línea siempre que exista un 
cruce, pero un emplazamiento adecuado puede resultar suficiente para aclarar 
a qué línea hace referencia una etiqueta. Esto puede verse en la figura 28.1. En 
ambos casos, la etiqueta hace referencia al cauce que procede de la parte superior, 
que es el principal de los dos que confluyen, y por tanto también el que da nombre 
al segmento posterior al cruce. En el caso a), la mayor similitud en las direcciones 
puede inducir sin embargo a pensar que el nombre hace referencia al cauce después 
de la intersección y al segmento horizontal antes de esta. Si el etiquetado de 
este segmento horizontal, que es un cauce de nombre distinto, no se encuentra 
suficientemente cerca del cruce, puede entonces pensarse que la etiqueta hace 
referencia a él también lo cual no es adecuado. Un emplazamiento tal como el 
mostrado en el caso b) aclara esta situación de forma elegante. 

Para el caso particular de las isolíneas, se recomienda situar la etiqueta sobre la 
propia línea, ya que facilita su lectura, especialmente en el caso de que aparezcan 
varias isolíneas separadas por poca distancia, como puede verse en la figura 28.2. 
Además, deben situarse las etiquetas de las isolíneas contiguas de tal forma que 
puedan leerse conjuntamente, para que sea sencillo interpretarlas en conjunto y 
apreciar sin dificultad la equidistancia y la dirección en la que los valores aumentan 
o disminuyen. 

Si la línea presenta cambios de dirección bruscos, es difícil hacer que la etiqueta 
siga la línea sin tener un aspecto «roto». Suavizar las líneas es una opción en este 
caso, al menos para usarlas como líneas base sobre las que situar las etiquetas. 

En el caso de polígonos, existe igualmente el problema de seleccionar un punto 
para emplazar la etiqueta. El centroide del polígono es la opción más inmediata, 

: Para el lector con curiosidad acerca de los algoritmos de etiquetado, baste citar que, salvo 
en el caso de una solución trivial, se trata de un problema de tipo NP Hard. 
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Figura 28.1: La posición de la etiqueta sobre una línea en un cruce puede dar lugar a 
ambigüedades (a) o a situaciones bien definidas (b) . 




a) b) 

Figura 28.2: Etiquetado de isolíneas. Deben situarse las etiquetas cercanas entre sí y 
sobre la línea, como en el ejemplo b) 


aunque no necesariamente ha de caer dentro de este si se trata de un polígono 
cóncavo, e incluso en ese caso puede no resultar la mejor elección. 

Como puede verse, para tomar este tipo de decisiones es necesario tener en cuen- 
ta no solo la posición del objeto y la de los circundantes, sino también «entender» 
qué es lo que estamos representando y qué otra información tenemos alrededor, lo 
cual resulta más complejo de trasladar a la aplicación SIG para que pueda hacerlo 
de forma automática. Tal y como comentábamos, la intervención del cartógrafo es 
en este caso imprescindible para incorporar este tipo de circunstancias y aportar 
al mapa la calidad que un mecanismo automático de etiquetado no es capaz por 
el momento de ofrecer. 

Una vez se ha definido la posición más adecuada para las etiquetas, es necesario 
decidir cómo representar cada una de ellas. Algunas etiquetas son más relevantes 
que otras, y la claridad con la que una etiqueta transmite su información depende 
en gran medida de cómo esta se escribe. Los conceptos de la tipografía son de 
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relevancia en este caso, y son a los que debemos acudir. He aquí algunos de ellos. 

■ El uso de las variables visuales que conocemos es limitado en el caso de las 
etiquetas y, salvo el tamaño, no suelen emplearse para diferenciar unas de 
otras o darles más importancia. 

■ El uso del tono o el valor debe llevarse a cabo con precaución. La legibilidad 
de la etiqueta, no obstante, está en relación con el fondo, ya que el color de 
este puede dificultar su lectura, y en esta situación es a veces necesario usar 
uno u otro tono para garantizar esa legibilidad. La etiqueta siempre está 
en un primer plano, por lo que el resto del mapa bajo ella y en su entorno 
forma parte del fondo. Como ya vimos, un adecuado contraste entre fondo y 
figura es importante, por lo que variar el color de una etiqueta puede a veces 
ser necesario para que esta pueda leerse correctamente. 

Algunos elementos se etiquetan sistemáticamente con colores establecidos, co- 
mo en el caso de los ríos, del mismo color azul que la propia geometría de estos. 

■ El tamaño es la forma principal de jerarquizar las etiquetas y darles más 
importancia. Se puede aplicar directamente sobre el tamaño de la fuente, 
aunque también es posible hacerlo sobre el grosor (fuente normal o negrita). 

■ El uso de mayúsculas o minúsculas sirve igualmente para conceder más 
importancia a unas u otras etiquetas. 

■ La separación entre caracteres se puede modificar para hacer que la etiqueta 
cubra un espacio mayor a lo largo de un objeto lineal, eliminando en ocasiones 
la necesidad de un etiquetado múltiple de esta. Un espaciado mayor también 
aporta mayor énfasis a la etiqueta. También se puede optar por un espaciado 
menor en etiquetas menos importantes, o en zonas con alta densidad, para 
disminuir el espacio que estas ocupan y evitar solapes. 

■ El uso de fuentes artísticas o decorativas no es recomendable. Se deben 
utilizar fuentes sencillas y que sean lo más legibles posible. 

La información necesaria para realizar todos estos ajustes a las etiquetas debe 
estar contenida en la tabla de atributos de la capa. Así, podemos incluir en esta 
campos que indiquen el ángulo en el que se escribe la etiqueta, el tamaño a utilizar 
o la separación de carácter, entre otras características. Incluso la propia posición 
puede especificarse de esta forma. En caso de existir estos valores, el SIG los usará 
en lugar de aquellos que resultarían de la aplicación de los algoritmos de etiquetado 
automático de que disponga, entendiendo que el ajuste manual es de mejor calidad. 
Dado que este tipo de configuración es habitual si se desea crear un mapa de calidad, 
algunos SIG permiten la incorporación de capas de etiquetado, que contienen toda 
la información necesaria para el establecimiento de etiquetas, de forma que estas 
se incorporan al mapa por separado y no a partir de los objetos a los que hacen 
referencia y sus atributos. Esta manera de proceder, no obstante, es más laboriosa. 

En resumen, la tarea de etiquetar un mapa es compleja y normalmente va a 
requerir una cierta cantidad de trabajo manual por parte del creador del mapa. Los 
SIG disponen de herramientas para automatizar una parte de este trabajo, aunque 
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la implementación de estas herramientas es muy variada, y encontramos desde 
aplicaciones con poco más que un sistema trivial de etiquetado a sistemas complejos 
altamente configurables. En cualquier caso, incluso en el más avanzado de los 
programas, es muy probable que debamos llevar a cabo algún tipo de modificación 
o que debamos especificar manualmente algunos de los parámetros que el SIG 
emplea para llevar a cabo un etiquetado automático o semi-automático. 


28.3. Visualización de capas ráster 

Las capas ráster son, en lo que a visualización respecta, las que resultan más 
novedosas si las comparamos con lo que encontramos en un mapa clásico. A dife- 
rencia de las capas vectoriales, compuestas por elementos que sí aparecen en estos 
mapas y cuya estructura lógica se asemeja mucho a la estructura gráfica de un 
mapa a base de símbolos puntuales, lineales y de superficie, las capas ráster dan 
lugar a representaciones que no resulta tan frecuente ver en la cartografía clásica. 

La cartografía clásica, especialmente la relativa a lo que denominábamos carto- 
grafía base, se encarga de recoger qué es lo que hay en una determinada porción de te- 
rreno, llevando esto a cabo mediante la representación de una serie de objetos que se 
corresponden con aquello que encontramos en ese terreno. Este es un enfoque mucho 
más acorde con el modelo de representación vectorial, y más alejado del modelo rás- 
ter. La representación gráfica de variables continuas, las cuales se aprovechan plena- 
mente con el modelo ráster, no es objeto tradicionalmente de la cartografía, y de serlo 
se representan mediante geometrías simples, tales como las líneas en un mapa de iso- 
líneas. Es decir, para el cartógrafo clásico, e independientemente del tipo de variable 
a representar, los datos se manejan en un modelo de representación de tipo vectorial. 

Esto obedece principalmente al gran detalle que tiene una capa ráster, el cual 
hace inviable el uso de un planteamiento similar a la hora de crear un mapa sin 
la ayuda de un SIG. El cartógrafo puede trazar unas isolíneas sin dificultad para 
representar la topografía, pero dividir el lienzo del mapa en miles de pequeños cua- 
drados y colorear cada uno de un color según su elevación es por completo inviable. 
Más aún, disponer de los datos a representar en este caso (que constituirían un 
MDE), resulta también imposible si no se dispone de un ordenador para calcularlo. 

Por todo ello, las capas ráster nos van a permitir crear representaciones algo 
distintas a las habituales en la cartografía clásica y, aunque las diferencias concep- 
tuales con respecto a la visualización de capas vectoriales son pocas, hay algunas 
ideas que deben detallarse. 

Formalmente, y al igual que de cara a su análisis, podemos considerar una 
capa ráster como una capa vectorial de polígonos (cuadrados en este caso). No 
obstante, e igual también que para el análisis, la regularidad de la capa ráster es 
el elemento clave que aporta la diferencia más importante, y en el que reside la 
particularidad de ese modelo de representación. 
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Si a cada uno de los polígonos cuadrados de los que se compone una capa ráster 
le asignamos un color, podemos considerar que el mapa resultante es equivalente 
a un mapa de completas, aunque con tres características peculiares: las unidades 
tienen un mismo tamaño todas ellas, este tamaño es normalmente muy pequeño 
y tiene dimensiones muy reducidas en la representación, y las unidades están 
situadas de forma regular en una malla. Estas características hacen que algunos 
de los inconvenientes de los mapas de coropletas no se presenten, y permiten un 
uso distinto de las variables visuales. 

Por ejemplo, el uso del tono como variable ordenada, que ya vimos que en ciertos 
casos sí resulta adecuado, se puede dar en las capas ráster. Como ya se mencionó 
al desarrollar las variables visuales, puedes encontrar abundantes ejemplos de 
representaciones así en los capítulos de la parte dedicada a procesos dentro de este 
libro. La regularidad de la malla de celdas, junto con la autocorrelación espacial 
y la continuidad de una variable a representar, hacen que cada celda esté rodeada 
de otras de valores similares, lo que aporta también una continuidad visual que 
puede aprovecharse para emplear esquemas ordenados basados en el tono. 

Tanto si se usa el valor como si se usa el tono, otra de las consecuencias de la es- 
tructura de una capa ráster, y en particular del pequeño tamaño de sus celdas es el he- 
cho de que resulta de interés aumentar el número de clases en que dividimos los valo- 
res de la variable para asignarles el correspondiente valor o tono como variable visual. 
La mayor resolución espacial con la que trabajamos se puede acompañar también de 
una mayor resolución cromática para obtener representaciones de mayor riqueza. 

Mencionábamos en el apartado 27.4.1 que no se recomienda un número de clases 
mayor de 7 u 8, ya que haría complejo el identificar cada una de ellas en la leyenda 
y conocer la cantidad exacta que se representa. Ello no significa, sin embargo, que 
el ojo humano no pueda distinguir más de 8 valores distintos de un tono dado. Si 
extendemos el número de clases, podemos lograr un efecto de transición suave entre 
los colores de las distintas celdas y eso, aunque no facilite la identificación de un color 
concreto con su valor asociado de la variable representado, crea una representación 
mucho más informativa. Puede verse esto claramente en la figura 28.3 

Las representaciones de la parte derecha de la figura, con un total de 255 clases, 
dan más detalle sobre la distribución de la variable a lo largo del mapa que las de 
la parte izquierda, con 8 clases. Saber en qué rango de valores se encuentra una 
zona dada del mapa puede resultar más difícil e impreciso, pero a cambio tenemos 
más detalle. En un mapa de coropletas, con unidades grandes bien diferenciadas, 
usar más clases no aporta más detalle sobre la distribución de la variable, ya que 
falta esa suavidad en las transiciones entre unidades. En una capa ráster, por el 
contrario, la ganancia es notable. 

La segunda representación de la figura, correspondiente a una capa de relieve 
sombreado, muestra de forma más clara lo anterior. El valor recogido en esta capa 
representa el ángulo de incidencia de la fuente de iluminación, lo que se traduce 
en un color más claro o más oscuro, tal y como correspondería a una mayor o 
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Figura 28.3: Representación de dos capas ráster con valores de elevación (a) y ángulo 
de iluminación (b) mediante 255 (izquierda) y 8 (derecha) clases. 


menor iluminación sobre el terreno. Mientras que la representación de la izquierda, 
con más clases, tiene un aspecto más realista ya que se asemeja a la cantidad de 
diferentes grados de iluminación que nuestro ojo percibiría en la realidad, la de 
la derecha pierde gran parte de su atractivo visual y de su capacidad de hacer 
patente el relieve (esto es especialmente notable en la zona llana de la parte superior 
izquierda). En este caso, el uso de un número limitado de clases no es adecuado, 
ya que el carácter de esta capa es eminentemente visual, y los valores que puedan 
contener la celdas no son relevantes, pero sí lo es convertirlos de la forma más fiel 
posible en distintos grados de iluminación. 
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28.4. Combinación de capas 

Argumentábamos en los primeros capítulos de este libro, cuando presentábamos 
el concepto de capa , que el verdadero éxito de este concepto es la separación de los 
distintos tipos de información geográfica, atomizando esta en unidades autoconteni- 
das que guardan tan solo la información relativa a una variable o fenómeno concreto. 
Así, cuando adquirimos un mapa impreso, obtenemos muchas variables distintas que 
no podemos separar, pero en un SIG, y con la información ya separada en esas capas, 
la situación es muy distinta, dando lugar a un manejo más estructurado y eficaz. 

Pese a esto, resulta claro que a la hora de representar la información geográfica, 
una capa aislada no constituye la forma óptima de visualizar esta. Si en un mapa 
encontramos elementos variados, ello no obedece a la mera economía de espacio, 
sino a que añadir información adicional a la de esa capa que queremos representar 
nos ayuda a entenderla mejor. Los procesos que tienen lugar en el espacio están 
relacionados unos con otros, y visualizar esas relaciones aporta una mayor riqueza 
a la visualización, haciendo que sea más sencillo extraer la información contenida 
en ella. Podemos ver un claro ejemplo de esto en la figura 28.4 




Figura 28.4: Añadir capas adicionales que complementen a aquella que resulta de interés 
nos ayuda a interpretar mejor esta y a lograr una representación más eficaz. 

La capa que representa la cuenca vertiente a un punto, y que contiene un solo po- 
lígono, resulta mucho más útil visualmente si la acompañamos de elementos básicos 
como el relieve y los cauces principales. La imagen de la derecha es autoexplicativa 
y se ve claramente gracias al relieve que el polígono delimita la cuenca. En la de 
la izquierda esa información no puede deducirse únicamente de la capa de interés. 

Aunque sencillo de llevar a cabo en lo que a manejo del SIG respecta, combinar 
capas es un proceso que también debe realizarse con conocimiento y en el que, si se 
realiza correctamente, las diferencias pueden ser notables. No solo se trata de dar 
espacio dentro del mapa a toda la información que esas capas contienen, sino que 
exista una sinergia entre ellas en la medida de lo posible, para que se complementen 
mutuamente como partes de un conjunto. Veremos en este apartado algunas ideas 
a tener en cuenta en este sentido. 
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a) 



b) 




Figura 28.5: Variar el orden de las capas puede suponer un cambio radical en la 
representación final obtenida. Todas las imágenes proceden del mismo conjunto de capas, 
pero las representaciones son muy distintas. 


El primer aspecto a considerar es el orden de las capas, que indica cómo se 
disponen estas las unas sobre las otras y definen el orden de pintado. Si una 
misma zona está ocupada por elementos de varias capas, solo serán visibles los 
correspondientes a la capa superior, ya que la representación de los pertenecientes a 
las demás quedará oculta. El efecto es el mismo que si pintáramos en un papel algo 
y encima de ello pintáramos después algo distinto. Tan solo veríamos esto último. 

La figura 28.5 muestra un claro ejemplo de lo anterior en el que se puede 
apreciar la diferencia que supone variar el orden de las capas. 

A pesar de estar construidas a partir de las mismas capas, las representaciones 
mostradas en la figura son muy distintas como documentos cartográficos y no 
proporcionan la misma información. Así, en el caso b), prácticamente toda la 
información esta «oculta», ya que hay una capa que la cubre. En el caso c) sucede 
que las zonas urbanas (en marrón) están situadas por encima de las capas de ríos 
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y vías de comunicación, dando la sensación de que estas últimas desaparecen al 
entrar en dichas áreas urbanas. Este puede ser un efecto deseado en ciertos casos, 
para enfatizar las zonas urbanas y su contorno, pero la representación es menos 
informativa en caso de que quiera detallarse el trazado de cauces y carreteras. 

Se ve claramente que el orden de pintado es importante, y que un correcto 
orden es vital para acomodar todos los elementos a representar y que cada uno 
cumpla su labor como elemento informativo. 

Sabemos que las capas ráster llenan todo el espacio y contienen valores en 
todas sus celdas (o píxeles en el caso de imágenes). Por ello, van a tapar lo que 
se sitúe por debajo de ellas y no resulta buena idea situarlas en lo alto del orden 
de pintado. En su lugar, se deben considerar como capas base sobre las que situar 
las restantes, de tal modo que no impidan a estas visualizarse correctamente. 

Con un razonamiento similar, podemos establecer la mejor forma de ordenar las 
capas vectoriales, situando por norma general los polígonos y encima de estos las 
líneas y los puntos respectivamente. Esta regla es, lógicamente, muy genérica, y en 
cada situación se ha de evaluar la conveniencia de adoptar otra disposición, siempre 
con objeto de evitar que unas capas dificulten la correcta interpretación de otras. 

En ocasiones, un determinado orden viene impuesto por el significado que tienen 
las capas. Por ejemplo, si nuestro mapa contiene una capa con la red de drenaje y otra 
con carreteras, lo lógico y habitual es que las carreteras estén por encima de los ríos, 
ya que lo normal es que pasen por encima de estos y no al contrario. En la practica 
cartográfica, este tipo de situación se resuelve simbolizando de forma particular este 
tipo de coincidencias, como se muestra en la figura 28.6. Esto requiere en el SIG unas 
capacidades avanzadas de edición gráfica, algo que, como vimos en el primer capítulo 
de esta parte, no es muy común. No obstante, algunos SIG incluyen no solo esas ca- 
pacidades, sino también funcionalidades que crean automáticamente esos elementos 
gráficos en función del análisis de las capas, de tal modo que automatizan la tarea. 





Figura 28.6: Representación errónea (a) y correcta (b) de capas al combinar una de carrete- 
ras (en marrón) y otra de red de drenaje (en azul) . La inclusión de un elemento que simbolice 
el cruce (c) supone, no obstante, una mejor solución desde el punto de vista cartográfico. 

Una funcionalidad de que disponen los SIG para la combinación de capas es el 
uso de transparencias y semi-transparencias. Estas se pueden aplicar tanto a capas 
ráster como vectoriales, de forma que puede verse a través de ellas y así presentar 
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la información de otras capas que se encuentren por debajo. Por ejemplo, la 
representación mostrada en la figura 28.4 hace uso de esta técnica. El polígono que 
delimita la cuenca vertiente es semi-transparente, de tal modo que la capa de relieve 
sombreado que está debajo puede verse, dando la sensación de que sigue ese relieve. 

Si se usa semi-transparencia para una capa temática (por ejemplo, en un mapa 
de coropletas) , no debe perderse de vista que el color varía respecto al original que 
ha sido asignado a cada polígono, ya que se «mezcla» con el color de cada píxel 
correspondiente a la representación de las capas inferiores. Esto puede resultar 
confuso a la hora de interpretar las componentes del color, ya que no coincidirán 
con las mostrada en la leyenda. Más aún, y como puede también apreciarse en la 
figura 28.4, el color del polígono, que debería ser único, no lo es, ya que la parte 
que se transparenta a través de este no es uniforme. En el caso mostrado en la 
figura, este hecho no tiene importancia, pero debe considerarse al representar otro 
tipo de variables en las que el color tiene un significado definido, para garantizar 
que ese significado se transmite de igual modo. 

En el caso de una capa ráster, puede aplicarse una transparencia total, haciendo 
que determinadas partes de esta no se representen. A pesar de que la capa ráster 
contiene información en todas las celdas de su extensión, no todas se representan. 
Esto es especialmente útil para capas de tipo categórico. La figura 19.10 es un 
buen ejemplo de esto. En ella, la capa que contiene el área de influencia es una 
capa ráster, ya que ha sido creada mediante un análisis ráster (repasa el apartado 
para ver cómo se ha calculado, si no lo recuerdas). Sin embargo, se puede combinar 
con la capa de pendientes, ya que solo se pintan las celdas correspondientes a dicho 
área de influencia pero no las restantes. Para llevar esto a cabo se suele asignar 
la transparencia a un valor o serie de valores definidos, habitualmente al valor 
que codifica la ausencia de datos (que en este caso es el empleado para codificar 
aquellas celdas que no forman parte del área de influencia calculada) . 

El uso de transparencia sirve también para combinar imágenes que se solapan y 
eliminar las partes de estas que no contienen información. Como vimos en la sección 
5.3.1, la forma de la imagen es siempre rectangular y tiene una orientación fija. 
Esto no ha de coincidir obligatoriamente con la información que contiene, siendo 
necesario en ese caso rellenar las áreas sin información con algún tipo de valor. A 
la hora de combinar capas, esos valores de relleno no interesa representarlos. 

La división horizontal de los datos puede dar lugar a problemas en el caso de 
capas vectoriales o capas ráster distintas de imágenes, para las que es necesario 
establecer unas características de representación en función de sus atributos, en 
caso de que la información acerca de una variable se encuentre dividida en varias 
capas, cada una de las cuales cubre una porción del terreno. Un SIG incorpora 
habitualmente herramientas para que estas capas, así divididas para una mejor 
gestión, puedan unirse en una única, y al hacer esto, la capa resultante tendrá 
asignado un esquema de representación también único, de forma que toda ella se 
visualizará de forma coherente. En tal caso, no encontramos problema alguno. 
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En el caso, sin embargo, de trabajar con las capas de forma independiente, 
y si estas han de combinarse en una misma representación, es necesario que los 
esquemas de representación sean coherentes unos con otros, para que en la represen- 
tación global aparezcan como una única capa de información. De modo contrario, 
la representación será ambigua y confusa, y no mostrará de la forma adecuada 
la información que esas capas contienen. No considerar esta circunstancia lleva 
a errores tales como los mostrados en la figura 28.7. 




Figura 28.7: a) dos representaciones incorrectas de conjuntos de capas, debido a 
incoherencia entre los parámetros de representación empleados en cada una de ellas, b) 
representación correcta y homogénea con parámetros de representación comunes. 


En el caso de la derecha, dos MDE se representan con una misma gradación 
de colores. Se usa una representación por intervalos, pero, debido a que los valores 
extremos a partir de los cuales se crean dichos intervalos son distintos, estos 
intervalos resultan también distintos, y un mismo color representa un valor de 
elevación diferente en cada capa. Por esta razón, se hace muy patente la línea de 
unión entre ambas capas, ya que, pese a que existe una continuidad suave entre 
los valores, no lo es así en lo que respecta a su representación. 

El mismo par de capas puede representarse de forma correcta sin más que 
establecer un único conjunto de intervalos para ambas, de tal modo que los valores 
máximos y mínimos entre los que se sitúen sean los máximos y mínimos absolutos 
del conjunto de capas. 

En el caso de la izquierda (que ya se describió en el apartado 18.4 dedicado a la 
operación de juntar capas vectoriales) se presenta el mismo error, aunque no resulta 
tan patente a primera vista como en el anterior. La representación esta realizada 
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a partir de cinco capas de datos, una para cada continente, asignando colores en 
función de la población de cada país y con un total de 10 intervalos. Aunque la 
representación no revela ningún problema tal como la línea de sutura entre las capas 
ráster del ejemplo a), es incorrecta, ya que países con poblaciones muy distintas se 
representan con un mismo color. Así, Alemania, el país más poblado del contiene 
europeo, y China, el más poblado de Asia, tienen el mismo color a pesar de este 
último tiene más de quince veces más habitantes que el primero. Una vez más, los 
intervalos empleados no son coherentes entre sí. En la representación de la derecha 
de la figura puede observarse el resultado tras haber ajustado convenientemente los 
parámetros de representación del conjunto de capas. Nótese que, pese a ser correcto 
desde este punto de vista, el mapa es poco informativo. La división en intervalos 
iguales que se ha empleado no resulta una buena opción en este caso debido a la 
presencia de unos pocos países con mucha más población que el resto. El uso de 
intervalos naturales o percentiles habría dado lugar a una representación más útil. 


28.5. Particularidades de la representación en panta- 
lla 

Tanto para las representaciones en papel como para las representaciones en 
pantalla se siguen unos mismos principios a la hora de diseñarlas, pero estas 
últimas presentan algunas características particulares que hacen necesario tener 
en consideración otros factores. Esto es especialmente cierto cuando consideramos 
que esa representación en pantalla se realiza desde dentro de un SIG como parte de 
una sesión de trabajo con este (es decir, que no estamos, por ejemplo, visualizando 
un mapa escaneado con una aplicación de edición de imágenes sino trabajando 
en el SIG y creando la visualización como un elemento más de ese trabajo). 

Podemos distinguir dos bloques fundamentales de diferencias que hacen que 
un mapa pensado para ser visualizado en la pantalla mientras ejecutamos un SIG 
no deba diseñarse exactamente igual que si estuviera pensado exclusivamente 
para ser utilizado en un soporte impreso: la baja resolución de la pantalla y la 
interactividad de la propia representación. 

El primer aspecto a considerar es la baja resolución de una pantalla en compara- 
ción con un documento impreso. Mientras que sobre el papel un mapa puede impri- 
mirse a una resolución de varios cientos de puntos por pulgada (dpi) , en la pantalla la 
resolución viene limitada por el tamaño de los píxeles, que es mucho mayor que el del 
mínimo punto que se consigue imprimir por medios mecánicos. En una pantalla, la 
resolución es del orden de 100 píxeles por pulgada. Por eso, si te acercas a la pantalla 
de tu ordenador, puedes ver los píxeles individuales si tienes cierta agudeza visual. 
Por el contrario, incluso con una impresora de uso doméstico, distinguir el mínimo 
punto que esta es capaz de imprimir está por encima de la capacidad del ojo humano. 
Esto quiere decir que el papel permite una definición mucho mayor que la pantalla, 
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ya que incluso los elementos de menor tamaño del mapa van a estar dibujados con 
una serie puntos de menor tamaño que permiten lograr una nitidez muy elevada. 

A la hora de preparar cartografía impresa, la resolución no es un problema, ya 
que las capacidades de que se dispone superan a las necesidades que el cartógrafo 
puede tener. En la pantalla, sin embargo, algunos elementos pueden no aparecer 
con suficiente claridad y, aunque en papel cumplan su función correctamente, es 
conveniente sustituirlos por otros más adecuados cuando no se trabaja sobre un 
medio impreso. Los siguientes son algunos de los elementos que deben evitarse o, al 
menos, emplearse de manera distinta a la hora de crear representaciones en pantalla. 

■ Fuentes con ornamentos tales como sombreados. Si son de pequeño tamaño, el 
sombreado no puede pintarse con suficiente nitidez y perjudica la legibilidad 
del texto. 

■ Fuentes con serifas. Las serifas (Figura 28.8) están pensadas para hacer más 
cómoda la lectura del texto impreso cuando este tiene una longitud consi- 
derable tal como en un libro, y consisten en pequeños adornos generalmente 
situados al final de las líneas. Por su pequeño tamaño, no se representan con su- 
ficiente definición en la pantalla, lo que causa pérdida de legibilidad. Por ello, 
se recomienda el uso de fuentes sin serifas en documentos pensados para visua- 
lizarse en pantalla, tales como paginas Web o como un mapa dentro de un SIG. 

■ Rellenos con tramas de paso muy fino. Si las líneas de un tramado están 
muy juntas, la baja resolución de la pantalla puede ser insuficiente para 
separarlas, haciendo difícil para el observador reconocerlas. 

■ Punteados. Al igual que en el caso anterior, si el punteado no tiene un paso 
suficiente, puede no resultar evidente la discontinuidad de la linea, creándose 
una representación ambigua. 

AaBbCc 

Figura 28.8: Concepto de serifa. 

El segundo aspecto a considerar es el relativo a la interactividad de las represen- 
taciones. A diferencia de un mapa impreso, en un SIG lo que vemos no es un elemento 
estático, sino dinámico. En este contexto, dinámico no quiere decir que el mapa cam- 
bie o que represente un proceso dinámico (que también es posible, como veremos 
más adelante en otro apartado de este capítulo), sino que el usuario puede alterarlo 
utilizando por lo menos las herramientas más fundamentales que proporcionan 
interactividad, tales como el desplazamiento, el acercamiento o el alejamiento, 
según ya vimos en el apartado 22.2.2. Este hecho hace que aparezcan algunos 
problemas, entre los que destacan los relacionados con el rendimiento y aquellos 
que derivan de la posibilidad de variar sensiblemente la escala de representación. 

Respecto al rendimiento, no debe olvidarse que cada vez que formamos la 
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imagen de un mapa en la pantalla (algo que sucede cada vez que ajustamos el 
encuadre mediante esas herramientas interactivas), el SIG ha de realizar un gran 
número de cálculos correspondientes a operaciones como las siguientes: 

■ Remuestreo de las imágenes. 

■ Asignación de colores o patrones a los distintos elementos (geometrías en 
capas vectoriales o celdas en capas ráster) en función de los valores asociados 
a estos. 

■ Dibujado de geometrías. 

En función de la complejidad y el tamaño de las capas que estemos represen- 
tando, así como del número de estas, generar esa representación puede suponer un 
volumen muy elevado de operaciones, lo cual hará poco fluido el trabajo en el SIG, 
llegando incluso a hacer inoperativa la propia interactividad del programa en un 
caso extremo. Cuando esto sucede, es necesario sacrificar algo de precisión y rigor 
cartográfico en beneficio del rendimiento, especialmente cuando la falta de ren- 
dimiento y la lentitud del sistema nos dificulten la realización de otras operaciones 
tales como, por ejemplo, el análisis de esas mismas capas que representamos, o 
incluso la propia navegación. 

Trabajar con capas de menor detalle — por ejemplo, capas ráster de menor 
resolución o capas vectoriales con líneas simplificadas (véase 18.7) — es una solución 
a este problema, aunque no necesariamente excluye la posibilidad de trabajar con 
las capas originales. Un planteamiento multi-escalar en el que, según la escala, 
se visualicen unas u otras capas, es una solución frecuente a esta problemática. 
Vimos estas ideas en el apartado 3.5.2, donde presentamos el concepto de pirámide 
como recurso empleado en estos casos para el trabajo con capas ráster. 

También se puede aumentar la velocidad de dibujado utilizando colores lisos 
en lugar de tramas, y evitando los textos de gran tamaño o los símbolos complejos 
que provengan de imágenes muy detalladas y de gran tamaño. 

Por último, el hecho de que la escala de la representación pueda variar según 
la voluntad del usuario puede causar problemas con algunos de sus elementos tales 
como símbolos o etiquetas de texto. Si todos los elementos del mapa se escalan 
proporcionalmente, una reducción importante de escala disminuirá el tamaño del 
texto hasta hacerlo ilegible. Por el contrario, si aumentamos la escala el tamaño 
puede ser excesivo. La figura 28.9 muestra este hecho. 

El mismo problema sucede en el caso de emplear símbolos. Si, por ejemplo, 
tenemos una capa de puntos con la localización de bocas de incendios y represen- 
tamos cada uno con un pequeño dibujo de una de ellas, al aumentar el tamaño de 
cada icono se perderá definición, mientras que al disminuirlo la pantalla no tiene 
resolución suficiente para dibujarlo correctamente y no se identificará su forma. 
En general, el empleo de símbolos puntuales de este tipo se desaconseja a la hora 
de representar cartografía en pantalla. 

Una solución a esto es especificar un tamaño absoluto de estos elementos que 
no varíe con la escala. Es decir, que un símbolo o una etiqueta de texto tengan 
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Figura 28.9: El cambio de escala varía el tamaño de los símbolos tales como las etiquetas, 
haciéndolos demasiado pequeños (a) o demasiado grandes (b) 


siempre el mismo tamaño en pantalla y ocupen los mismos píxeles. A escalas bajas, 
sin embargo, este método puede dar lugar a representaciones saturadas, como 
se observa en la figura 28.10. Este problema es más notable si se tiene en cuenta 
que en pantalla se emplean generalmente tamaños de letra más grandes que en 
un mapa impreso, por lo que se debe reducir la cantidad de texto mostrado para 
evitar una densidad de etiquetas demasiado elevada. 

Las particularidades que hemos visto en esta sección se refieren a la represen- 
tación en la pantalla de un ordenador de sobremesa o portátil, pero, como vimos 
en el capítulo 24.1, los SIG sobre dispositivos móviles tienen a su vez sus propias 
características en lo que a dispositivos de representación respecta. Por ello, y según 
los casos, todo lo visto en este apartado debe considerarse de modo específico en 
estos casos, añadiendo los condicionantes que este hecho puede implicar en las 
distintas funciones de representación. 


28.6. Visualización tridimensional 

La visualización tridimensional es una de las tendencias más importantes dentro 
del ámbito SIG en la actualidad. Aunque el SIG de escritorio sigue siendo fundamen- 
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Figura 28.10: Representación saturada al representar elementos con tamaño fijo a una 
escala baja. 


talmente una herramienta 2D, las aplicaciones con capacidades 3D van ganando 
relevancia al tiempo que incorporan cada vez más funcionalidades que las acercan a 
las del SIG de escritorio completo. Además de su mejor capacidad para incorporar 
de forma realista los elementos geográficos (que son tridimensionales, así como los 
fenómenos que los originan) , una de las razones indudables del éxito y la populari- 
dad del SIG 3D es su gran atractivo visual. La tercera dimensión hace más sencillo 
interpretar buena parte de la información representada, ya que permite mostrarla 
de un modo más asequible y fácil de entender, especialmente para el observador no 
especializado. Frente al mapa impreso o la representación bidimensional en panta- 
lla, la representación en tres dimensiones resulta mucho más intuitiva y «real». Al 
ser más natural y cercano a la realidad que se representa, un mapa tridimensional 
se percibe menos como un elemento simbólico y más como una realidad. 

Por todo ello, porque el factor visual es de gran relevancia en los SIG 3D, una 
adecuada visualización de la información geográfica tiene mucha importancia para 
poder aprovechar al máximo todas sus posibilidades. Las siguientes son algunas de 
las ideas que deben considerarse al trabajar con representaciones tridimensionales, 
junto, por supuesto, todas las que ya hemos detallado para las representaciones 
2D habituales: 

■ Existencia de distintas formas de perspectiva. Existen distintas for- 
mas de perspectiva para lograr trasladar la realidad tridimensional a la 
superficie plana del papel o la pantalla. Estas alteran la percepción de las 
distintos elementos de la imagen, y en algunas aplicaciones es posible escoger 
la que se desea, con lo cual aparece un nuevo parámetro que modifica la 
representación y debe ser ajustado convenientemente. 

■ Importancia de la posición del observador y los ángulos de visión. 
En un mapa plano no existe como tal el concepto de posición del observa- 
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dor. Aumentando o disminuyendo la escala, el efecto producido es similar 
a alejarse o acercarse al mapa, y al desplazar este y cambiar el encuadre, 
podemos considerar que el observador se desplaza, pero estos movimientos 
no afectan a cómo percibimos la información del mapa. Desde la vista cenital 
que representa un mapa, apreciamos sin dificultad las dos dimensiones que 
este contiene, y ello nos permite interpretar el significado de sus distintos 
elementos. En el caso tridimensional, la posición del observador no viene 
únicamente definida por una posición y un alejamiento (que resultan en un 
encuadre y una escala dadas) , sino por una serie de ángulos que al modificarse 
alteran la visión de las variables representadas. 

Por ejemplo, para el caso de que existan elementos tridimensionales tales como 
edificios, una vista de tipo cenital no dejará percibir adecuadamente la eleva- 
ción de estos. Por el contrario, una capa ráster de temperaturas representada 
dentro de esa vista tridimensional sobre el terreno se apreciará mejor si nos 
situamos por encima de ella, de forma que la línea de visión sea perpendicular. 
En otros casos, para una única variable es necesario elegir la visualización en 
función de aquello que queramos mostrar de forma más clara. Si consideramos 
una capa de líneas (tridimensional, es decir, formada por un conjunto de 
puntos definidos mediante 3 coordenadas cada uno) que representa la trayec- 
toria de un avión, la vista cenital nos permitirá ver el recorrido de este, pero 
será difícil apreciar si ha ascendido o descendido durante el vuelo. Una vista 
de perfil soluciona esto, pero hace complicado apreciar el desplazamiento en 
el eje perpendicular a la linea de visión, por lo que el recorrido no se conoce 
con la misma exactitud. Incluso si este puede apreciarse de algún modo (por 
ejemplo, variando el grosor de la línea cuando el avión se acerca o aleja del 
observador para así representar la distancia en profundidad) , una capa base 
con un mapa topográfico no se visualizaría apenas desde esa vista de perfil, ha- 
ciendo imposible saber cuándo en ese recorrido se ha pasado de un país a otro. 
A diferencia de lo que sucede con un mapa bidimensional, en una vista tridi- 
mensional no se aprecian de igual modo todas las dimensiones implicadas en 
la representación, ya que el soporte (la pantalla) solo posee dos dimensiones. 

■ Orden de capas con un significado distinto. El orden de representación 
de capas, según vimos en un punto anterior de este capítulo, define la forma 
en que estas se pintan y la jerarquía que condiciona si la representación de 
unas capas tapa a la de otras. Se puede considerar como que unas capas se 
encuentran «encima» de otras. En el caso de una vista 3D, este concepto de 
«encima» tiene sentido solo si las capas no tienen de por sí una información 
sobre su altura y se pintan a una altura arbitraria, tal como por ejemplo, sobre 
el terreno. En caso contrario, será la propia información de la componente 
z la que dicte dónde se pinta cada capa, y la posición del observador la que 
condicione cómo se visualizan. En realidad, y salvo para el caso de imágenes 
que se van a representar a una misma altura y se sobreponen (ya que dentro 
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de la vista 3D ocupan el mismo lugar en el espacio) , el concepto de orden 
de las capas no existe como tal cuando trabajamos con una vista 3D. 

■ Diferentes formar de incorporar objetos volumétricos. Existen di- 
versas formas de incluir objetos 3D en una vista tridimensional, la más directa 
de las cuales es a través de un modelo que defina el objeto a representar. Estos 
objetos son el elemento adicional que, en el SIG 3D, acompaña a los puntos, 
líneas y polígonos que conforman las geometrías empleadas en el SIG 2D. 
Asimismo, se pueden crear geometrías 3D a partir de geometrías 2D como 
polígonos, mediante el uso de algún atributo asociado a estas y el proceso 
conocido como extrusión. Dada una capa con la planta de unos edificios 
(expresada esta con un polígono), y si se conoce la altura de cada uno de 
ellos, pueden formarse volúmenes (Figura 28.11). Está técnica se emplea 
habitualmente para la creación de modelos de ciudades cuando no se dispone 
de modelos detallados de cada edificio. No obstante, cuenta con muchas 
limitaciones, ya que no permite recrear formas más complejas y no se dispone 
de información adicional sobre elementos sobre la componente vertical, sino 
tan solo de la planta, por lo que el alzado carece de detalle (es decir, esos 
edificios así recreados no tendrán, por ejemplo, ni puertas ni ventanas). 



Figura 28.11: La extrusión permite la creación de objetos volumétricos a partir de 
objetos planos. Los edificios de la imagen se han creado únicamente a partir de la planta 
y un valor de altura para cada uno de ellos. 

■ La dimensión vertical puede considerarse como otra variable vi- 
sual alternativa. En relación con lo comentado en el punto anterior, pueden 
crearse objetos volumétricos mediante extrusión sin que la dimensión vertical 
de estos represente necesariamente una altura como tal, sino que esté en 
función de un parámetro adicional. La figura 28.12 muestra un ejemplo de 
esto. En la capa visualizada en la imagen, que representa la población de una 
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serie de estados, se ha empleado la elevación para visualizar esta variable, 
además de recurrir a la habitual gama de valores de colores. Se trata de un 
mapa de coropletas en el que, sin embargo, no se acude únicamente a la 
variable visual color para simbolizar la componente temática. En realidad, 
estamos utilizando esta junto a la variable tamaño, una variable que para el 
caso de polígonos no existía en la representación bidimensional (existe, pero 
debe distorsionarse el contorno del polígono, algo que no resulta adecuado ya 
que este tiene un significado geográfico, o bien puede aplicarse sobre el grosor 
de la línea de contorno, lo cual no es tan fácil de percibir e interpretar). 



Figura 28.12: La dimensión vertical puede emplearse como variable visual para visualizar 
la componente temática de la información geográfica. 

Un planteamiento similar se puede aplicar a capas ráster, como se observa en 
la figura 28.13. La superficie mostrada sobre el terreno no es un relieve pro- 
cedente de una capa de elevación, sino de una variable distinta (por ejemplo, 
presión o temperatura del aire), la cual, además de simbolizarse mediante 
una rampa de colores, se representa en forma de relieve para hacer más 
evidente la variación de esos valores. La capa no tiene componente vertical, 
ya que es una capa ráster bidimensional, por lo que podemos utilizar esa 
tercera dimensión como variable visual. Hemos visto algunas visualizaciones 
así en otras partes del libro, por ejemplo en la figura 19.6. 

■ Exageración del relieve. Es habitual que en una visualización tridimen- 
sional exista algún modo de distorsionar el relieve para hacerlo más acusado. 
Mientras que las componentes x e y son proporcionales, la componente 2 
puede alterarse aplicándole un factor de escala para lograr que resulte más 
obvia la configuración del relieve (Figura 28.14). Esto sirve para acentuar la 
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Figura 28.13: La dimensión vertical puede utilizarse también para simbolizar capas 
ráster con variables distintas a la elevación. 


morfología del terreno, pero también puede ayudar a la comprensión de otras 
variables, especialmente si el relieve tiene influencia en ellas. Esta exageración 
se aplica al propio relieve terrestre (es decir, al relieve de un terreno real), 
así como al que puedan tener las distintas capas debido a la forma en que 
se representan, tal como en el ejemplo presentado en el punto anterior. 



Figura 28.14: La exageración del relieve permite hacer más evidente la configuración 
de este. 

Puede verse en lo anterior la necesidad de extender las ideas del diseño car- 
tográfico para considerar las peculiaridades de las vistas 3D, ya que si no se tienen 
estas en cuenta, los conceptos de la cartografía clásica, aunque imprescindibles 
igualmente en este caso, resultan no obstante insuficientes. Más información sobre 
principios de diseño cartográfico para vistas 3D puede encontrarse en [390] . 
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28.7. Visualización dinámica 

Mientras que un mapa impreso contiene una información estática que no varía y 
que representa el estado de unas determinadas variables en un instante dado, dentro 
de un SIG podemos crear representaciones que vayan variando para mostrarnos 
la evolución de esas variables. En un SIG es posible no solo visualizar una realidad, 
sino también el cambio que se produce en esa realidad. Esta visualización dinámica 
supone una herramienta de gran valor, especialmente para explorar la relación 
entre distintas variables y cómo el cambio de una de ellas afecta a las restantes. 

La visualización dinámica se obtiene mediante una animación, la cual se com- 
pone de una serie de escenas, del mismo modo que una película se compone de 
una serie de fotogramas. El mapa clásico representa una única de esas escenas, 
por lo que las nuevas posibilidades que una animación aporta con respecto a este 
son notables. Aunque de manera distinta a la de una vista tridimensional, una 
animación aporta también al mapa una dimensión adicional. 

El cambio que una animación muestra no ha de darse necesariamente a lo largo 
del tiempo, sino que puede ser en el espacio o a medida que varía cualquier otra varia- 
ble. Por ejemplo, una animación puede consistir en un trayecto a lo largo del cual se 
desplaza el observador y mostrar un «vuelo» entre dos puntos y cómo varía la reali- 
dad representada a medida que nos movemos. Este tipo de animaciones son muy co- 
munes en los visores tridimensionales, que permiten definir el trayecto y los paráme- 
tros que establecen cómo en los distintos puntos de este el observador mira al terreno. 

Podemos, asimismo, escoger cualquier variable adicional como eje de la ani- 
mación. Imaginemos, por ejemplo, que disponemos de una capa con una serie de 
divisiones administrativas, y que para cada una de ellas conocemos el numero 
medio de hijos por pareja. Supongamos que esta información la tenemos además 
divida por grupos en función de sus ingresos medios anuales. Podemos crear tantos 
mapas de coropletas como clases haya establecidas en función de esos ingresos, 
y simbolizar en cada una de ellas los polígonos correspondientes a las divisiones 
administrativas según el número de hijos. Si usamos esos mapas, cada uno de 
los cuales constituye una escena, para formar una animación, esta mostrará la 
variación del número de hijos en función de los ingresos medios. Esa última variable 
es el eje sobre el que se desplaza la animación, y el tiempo y el espacio no han sido 
usados de modo alguno para crear esta. 

Al la hora de crear una animación, debemos tener en cuenta no solo las seis 
variables visuales que estudiamos en el capítulo 26, sino otras seis nuevas, las 
denominadas variables visuales dinámicas[ 391]: 

■ Momento. El equivalente a la variable visual posición, indica el momento 
en la animación en que se produce un cambio de una escena a otra. 

■ Frecuencia. Indica la velocidad a la que se produce el cambio en la ani- 
mación. Si es demasiado lenta, puede aportar una longitud excesiva a esta, 
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mientras que si es demasiado rápida puede hacer difícil analizar e interpretar 
el cambio que se produce. 

■ Duración. El tiempo que cada escena se encuentra visible, que no tiene que 
ser el mismo para todas ellas. 

■ Magnitud del cambio. Indica cuánto cambia una escena respecto a la 
anterior. Si es pequeño, la animación sera fluida, mientras que si es muy 
elevado, la animación tendrá saltos bruscos. Dividido por la duración nos 
indica la tasa de cambio. 

■ Orden. La posición de cada escena dentro del conjunto, estableciendo antes 
o después de cuáles de las restantes aparece. 

■ Sincronización. Si la animación muestra la variación de varias variables, 
establece cómo el cambio en estas se encuentra relacionado. Una correcta 
sincronización ayuda a interpretar la relación que puede existir entre las 
variables que varían en la animación. 

En un entorno de visualización dinámica, el usuario pueden interactuar también 
con la representación dinámica, alterando las características de la animación del 
mismo modo que en una representación estática dentro de un SIG puede modificar 
el encuadre haciendo uso de las herramientas de navegación habituales. 


28.8. Otros elementos de visualización 

Además de permitir una representación distinta de los elementos clásicos del 
mapa y de las variables habituales, la visualización en un SIG puede ampliarse 
incorporando otros tipos de información distintos, que no tienen presencia en la 
cartografía tradicional. El ordenador es un soporte más potente que el mapa y 
soporta además otros elementos no visuales, de tal modo que ofrece múltiples 
formas de enriquecer cualquier representación. 

En este sentido, el mapa puede comportarse no ya como un documento que 
trasmite un tipo particular de información (la de tipo geográfico) , sino como un 
contenedor de muchas clases diferentes de información, todas ellas compartiendo 
el hecho de que pueden localizarse y posicionarse, y el mapa se convierte en el 
elemento de referencia desde el que acceder a todas ellas. Esta es una de las 
consecuencias del papel que los SIG han jugado haciéndonos ver la importancia 
de la información espacial que la mayoría de fenómenos tienen asociada, hasta el 
punto de que esa información geográfica, al ser puesta en un mapa, no constituye 
el objeto primordial de atención, sino es una información común a otros muchos 
tipos de información, actuando como nexo de estos. 

Algunos de los nuevos elementos que pueden añadirse a una representación 
en un SIG son los siguientes: 

■ Fotografías. Aunque un mapa puede contener fotografías, está muy limita- 
do en temas de espacio, y la presencia de estas es anecdótica. Por el contrario, 
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y gracias a sus elementos interactivos, un SIG puede incorporar fotografías 
solo a una determinada escala, y solo si el usuario así lo pide, haciendo clic 
por ejemplo en un símbolo concreto. Esto permite incorporar un número 
ilimitado de imágenes, permitiendo que estas complementen a la información 
visual del propio mapa. 

Un caso particular son las fotografías de tipo inmersivo, en las que el usuario 
puede navegar a través de fotografías del entorno como si se encontrara 
realmente en él (Figura 28.15). 



Figura 28.15: Las fotografías inmersivas permiten al usuario «meterse» en el mapa, 
ampliando la información que se muestra acerca de un lugar con imágenes reales tomadas 
sobre el terreno. Al igual que se navega por un mapa, el usuario puede navegar por el 
terreno haciendo uso de los controles interactivos correspondientes (imagen tomada de 
Google Street View). 


■ V ídeos. Del mismo modo que las fotografías, aportan más información sobre 
la zona representada y permiten una exploración mayor. Aunque son una 
tecnología aún muy experimental, existen también vídeos de tipo inmersivo. 

■ Sonido. Los elementos no han de ser necesariamente visuales, sino que 
pueden proporcionar información a través de otros sentidos distintos. 

■ Documentos. Un SIG puede incorporar documentos complejos tales como 
páginas Web o textos varios. 

Esta lista, no obstante, es muy susceptible de extenderse, ya que, virtualmente, 
un SIG puede incorporar cualquier elemento que pueda manejarse dentro de un 
ordenador. Cada día aparecen nuevas ideas sobre cómo combinar la información 
geográfica con otros tipos de información, y el SIG se sitúa en la base de todos 
estos nuevos planteamientos como herramienta fundamental de trabajo. 



28.9. Resumen 


Hemos visto en este capítulo cómo aplicar las ideas de capítulos previos a la 
representación de capas en un SIG. Cada tipo de capa tiene sus particularidades, 
y es en función de estas como hemos analizado la mejor forma de emplear las 
variables visuales y los conceptos de simbología gráfica que ya conocemos para 
simbolizar la información geográfica e incorporarla a un mapa. 

Puesto que una parte de las representaciones que generamos en un SIG están 
destinadas a ser representadas en pantalla, hemos analizado igualmente las impli- 
caciones que esto tiene a la hora de crear visualizaciones a partir de la información 
geográfica con la que trabajamos. Dos son los principales aspectos que han de 
tenerse en cuenta: la baja resolución de la pantalla en comparación con el papel 
y la interactividad propia de la representación. 

Además de trabajar con las formas cartográficas clásicas que un SIG es capaz 
de producir, existen nuevas formas que también hemos detallado, entre las que 
destacan las vistas tridimensionales y las animaciones. Junto a ellas, una de las 
tendencias actuales que aumentan las posibilidades de un SIG como herramienta de 
visualización es la incorporación de otros elementos tales como vídeos, fotografías 
u otros documentos de diversas clases. 



Parte VI 

El factor organizativo 




Capítulo 29 


Introducción. ¿Cómo se organiza un SIG? 


Trabajar con un SIG requiere una correcta organización a todos los niveles. Ahora que 
conocemos qué podemos hacer con un SIG, es el momento de ver cómo debemos plantearnos 
ese trabajo deforma óptima, dejando los aspectos técnicos y centrándonos en aspectos funcio- 
nales, organizativos y humanos, todos ellos igual de importantes que los anteriores ya vistos. 

En este capítulo se presentan las ideas fundamentales relativas a la organización de 
un SIG, su implantación y uso. Estas ideas serán básicas para entender posteriormente los 
restantes capítulos de esta parte, en los que se desarrollan por separado algunos conceptos 
relacionados y de gran importancia en la escena actual de los SIG. 


29.1. Introducción 

Como sistema complejo, un SIG requiere una organización eficiente que per- 
mita la correcta interacción de todos sus elementos y a todos los niveles. Esta 
organización es tanto más necesaria cuanto más volumen adquiere el sistema SIG, 
pues la propia complejidad de este puede conllevar la perdida de eficiencia y un 
uso en el que no se aprovechan plenamente las capacidades que el SIG ofrece como 
herramienta para el trabajo con datos geográficos. Una organización ineficiente 
es con frecuencia el cuello de botella más importante con el que un sistema SIG 
se encuentra y, paradójicamente, un aspecto con frecuencia olvidado. 

Los niveles de complejidad y volumen que encontramos actualmente en el 
ámbito de los SIG son muy superiores a los que existían hace apenas unos años, 
y requieren un enfoque distinto para poder lograr que todas las piezas del SIG 
funcionen de forma armoniosa y sincronizada, sin problemas derivados de una 
mala sincronización o de un incorrecto dimensionamiento del sistema. De hecho, 
el cambio que veíamos en el capítulo 1 en la definición del propio SIG, en el que se 
pasaba de una combinación de hardware y software para manejo de datos localizados 
espacialmente a un sistema complejo con más componentes, viene en gran medida 
desencadenado por la creciente consideración de la organización como un factor 
vital para el buen funcionamiento del SIG. Esa organización a la que originalmente 
no se le concedía la relevancia actual debido a que las circunstancias eran distintas, 
se ha demostrado en el contexto presente como un elemento clave para la gestión 
del SIG, y sin duda alguna un elemento al que ha de prestarse atención en cualquier 
utilización de un SIG más allá del ámbito meramente personal. 
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Implantar un SIG (es decir, establecer un entorno SIG susceptible de ser 
empleado productivamente) es una labor compleja. No basta con conseguir un 
software SIG, instalarlo en un ordenador, conseguir un conjunto de datos y ponerse 
a trabajar para dar respuestas a un problema dado en el que se requiera algún tipo de 
análisis geográfico. Ni siquiera en el supuesto de un contexto individual de trabajo 
— la expresión mínima que podemos encontrar, y por tanto la más sencilla de 
gestionar — la implantación resulta tan sencilla, ya que deben considerarse algunos 
aspectos antes de llevar a cabo cualquier acción. En este capítulo, vamos a ver cuáles 
son los puntos más importantes en los que debemos recalar a la hora de implantar 
un SIG, de forma que garanticemos el buen funcionamiento de este y establezcamos 
las condiciones adecuadas para poder trabajar con dicho SIG de forma óptima. 

Las ideas de este capítulo son de interés no solo para los encargados de implantar 
como tal el SIG y ponerlo en funcionamiento dentro de un determinado entorno, 
sino para todo aquel usuario o persona implicada de algún modo en ese entorno. De 
un modo u otro, resulta interesante conocer las reglas que regulan el funcionamiento 
del sistema si se es en cierta medida parte de él. Más aún, el trabajo con un SIG no 
solo incluye la utilización directa de este, sino también un cierto planeamiento de 
ese trabajo y una serie de tomas de decisiones previas. Estas consideraciones, que 
aparecen en la realización de cualquier proyecto con independencia de su índole, 
afectan también a los Sistemas de Información Geográfica, y será en este aspecto 
en el que profundizaremos a lo largo de este capítulo. 


29.2. La importancia de la organización 

Hemos citado ya la importancia de la organización dentro de un SIG, justifican- 
do así brevemente la conveniencia de estudiar la mejor forma posible de llevar esta 
a cabo. Veamos con más detalle el porqué de dicha importancia y las consecuencias 
directas que una adecuada implantación de un SIG tiene en el funcionamiento 
de este y, especialmente, en su eficacia, rendimiento y en la calidad del trabajo 
realizado con él. Las siguientes son las dos principales de ellas: 

■ Mejor relación entre elementos del sistema. El sistema no lo com- 
ponen únicamente un conjunto de elementos, sino también una serie de 
relaciones dentro del sistema. Si estas relaciones son fluidas y existe una 
sinergia entre las funciones que cada parte cumple en el todo del sistema, 
el funcionamiento de este último sera mejor. 

En el sistema representado por un SIG, algunos elementos como los datos 
son utilizados por todos los restantes. El diseño de este elemento debe tener 
en cuenta esa circunstancia para que no existan problemas al interactuar con 
otras partes del SIG, como pueden ser las personas o el hardware y software 
empleado. El hardware debe dimensionarse para tener capacidad suficiente a 
la hora de manejar los volúmenes de datos con los que se trabaja, y el software 
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debe ser capaz de poder acceder a los datos en el formato en que estos se 
encuentren almacenados. Por su parte, los datos deben ser los adecuados 
para satisfacer las necesidades de los usuarios que forman parte del sistema, 
para que estos, a través de los procesos de análisis y otras operaciones dispo- 
nibles, obtengan resultados de interés de una forma óptima. Consideraciones 
similares pueden realizarse si se consideran elementos distintos del sistema 
SIG y su interrelación particular. 

■ Mejor relación entre representantes de un mismo elemento del sis- 
tema. Los elementos del sistema son a su vez conjuntos de otros elementos. 
La parte humana de un SIG no es una única persona, del mismo modo que el 
software puede no ser una única aplicación, sino varias de ellas para realizar 
distintas tareas sobre la información geográfica. A medida que avanzamos 
en el desarrollo de los SIG, encontramos escenarios más complejos en los que 
se multiplica la magnitud de los distintos factores implicados (más gente, 
más datos, más potencia en el hardware empleado...), requiriéndose a su vez 
una organización interna de esos mismos factores. 

A la hora de planificar la implantación de un SIG, debemos tratar de homo- 
geneizar internamente cada uno de sus elementos, o al menos de incorporar 
mecanismos que garanticen una correcta comunicación y coordinación a 
todos los niveles. Esto puede implicar, por ejemplo, aplicar estrategias de 
trabajo coordinado para organizar el factor humano, o emplear esquemas 
comunes para el almacenamiento de datos. Si cada uno de los datos con 
que trabajamos presenta una estructura distinta, encontraremos el mismo 
problema que si las distintas personas que van a trabajar en nuestro entorno 
SIG hablan distintos idiomas y son incapaces de comunicarse. En esta situa- 
ción, puede resultar complejo y poco eficiente (o incluso ser por completo 
imposible) emplear varios grupos de datos de forma conjunta, restando así 
capacidades y eficiencia al sistema. 

Logrando lo anterior, el sistema SIG ofrece mejor funcionamiento, justificando 
así plenamente el esfuerzo desarrollado para su correcta implementación y organiza- 
ción, esfuerzo que, por otra parte, en ocasiones es notable y no debe menospreciarse. 


29.3. Organizando los distintos elementos de un SIG 

Ahora que ya sabemos por qué es importante una adecuada organización de 
un SIG, veamos algunas ideas básicas sobre la forma de lograr esta. Para ello, y 
puesto que la organización es un concepto íntimamente ligado a la estructura del 
SIG como sistema, veremos por separado cómo plantear esa organización para los 
principales elementos de este, los cuales ya conocemos bien de capítulos anteriores. 
Descubriremos así que la implantación de un SIG es mucho más que simplemente 
elegir una aplicación y utilizarla, y que una implantación que no cubra todos los 
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aspectos fundamentales que a continuación detallaremos es muy probable que 
presente problemas y falle a la hora de ofrecer respuestas a las necesidades a las 
que un SIG correctamente planificado puede responder. 

29.3.1. Datos 

Ya sabemos que sin datos no podemos trabajar en un SIG, por lo que la implanta- 
ción de este implica necesariamente la implantación de un conjunto de datos a partir 
de los cuales poder efectuar las operaciones propias del SIG. Esto conlleva el diseño y 
creación de una base de datos contra la que posteriormente trabajarán las distintas 
aplicaciones, bien sea para leer esos datos, modificarlos, o añadir nuevos datos. 

A la hora de planificar el diseño y creación de la base de datos, se deben 
considerar todas las actividades que a lo largo de su vida van a desarrollarse sobre 
ella. En función de esto, se establecen las distintas etapas a seguir, que en una 
primera aproximación pueden ser las siguientes: 

■ Recopilación de datos. Los datos a incluir en nuestro SIG pueden obtener- 
se de procedencias muy diversas, ya sea adquiriéndolos de proveedores priva- 
dos, de organismos oficiales o de cualquier otra entidad que disponga de los 
datos que van a ser necesarios. La elaboración de una lista de datos necesarios 
ha de realizarse considerando los futuros análisis que tendrán lugar sobre ellos, 
con objeto de saber qué datos hemos de obtener (es decir, qué variables del me- 
dio van a ser necesarias), pero también algunas características más detalladas 
de esos datos. Por ejemplo, si los usuarios de nuestro SIG van a hacer estudios 
a distintas escalas, es de interés contar con un mismo dato en esas escalas 
de trabajo, para así facilitar el manejo de datos y optimizar las operaciones. 
Si los datos que pueden obtenerse por las vías habituales no son suficientes, 
será necesario, siempre que ello sea viable dentro del contexto de la implanta- 
ción, elaborar aquellos que no hayan podido obtenerse. La creación de estos 
datos debe encaminarse a obtener un producto acorde con el resto de datos 
de que disponemos, para que puedan integrarse de la forma más sencilla 
posible y disminuyan el trabajo a realizar. 

En ocasiones, la creación de nuevos datos no implica obligatoriamente el 
desarrollo de trabajo de campo o la aplicación de técnicas como las que vimos 
en el capítulo 6 (por ejemplo, la digitalización) . Puede ser interesante elabo- 
rar nuevas capas de datos a partir de las ya disponibles, mediante procesos 
de análisis u operaciones como las que ya hemos visto en una parte anterior 
del libro. Aunque estos procesos pueden ser llevados a cabo por los usuarios 
en el momento de necesitar un determinado dato, crear previamente ese dato 
y ofrecerlo junto a los demás puede ser interesante por varias razones. 

En primer lugar, si son varios los usuarios que en un momento concreto van 
a necesitar ese dato, evitaremos la repetición innecesaria del proceso, con la 
consiguiente ganancia de tiempo. En segundo lugar, un usuario puede no estar 
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capacitado o no disponer de la experiencia necesaria para crear correctamente 
ese dato, especialmente si el proceso a seguir es complejo o proclive a la 
aparición de errores. El hecho de que un usuario necesite un dato no implica 
que conozca la forma de elaborarlo a partir de otros datos primarios. 

■ Preparación de los datos. Obtener los datos es solo la mitad del trabajo. 
Si creamos nuestra base de datos con los datos que hemos adquirido tal y 
como han sido suministrados, es probable que el trabajo posterior sea difícil y 
complejo. Salvo que todos los datos provengan de un único proveedor, vamos 
a tener datos con una gran heterogeneidad, la cual no favorece en absoluto 
el trabajo fluido con ellos. Incluso si todos los datos tienen un origen común, 
es necesario prepararlos para el uso particular que esperamos se realice en 
nuestro SIG, teniendo en cuenta aspectos que no han sido considerados por 
el proveedor. Los siguientes son algunos de los apartados a los que debe 
prestarse atención para la preparación de datos: 

• Extensión geográfica. Algunos datos pueden cubrir una región mu- 
cho mayor que la que se espera vaya a ser necesaria en el desarrollo de 
proyectos dentro de nuestro SIG. En tal caso, «recortar» la extensión 
disminuye el volumen de datos y facilita su manejo. 

• Formato. El formato debe ser el adecuado para que las aplicaciones 
puedan leer los datos, lo cual no siempre sucede. Cada proveedor de 
datos suele tener unas pautas a la hora de distribuir sus datos, y esto 
puede no coincidir con las capacidades de lectura de datos del software 
que vamos a utilizar. En tal caso, es necesaria una conversión de formato 
para que los usuarios no encuentren dificultades en ese sentido. 

• Modelo de datos. La forma en que esta recogida la información 
geográfica define en gran medida lo que podemos hacer con ella una vez 
la incorporemos al SIG, como vimos en el capítulo 5. Si, por ejemplo, 
sabemos que una gran parte del trabajo en nuestro SIG va a implicar 
el análisis de Modelos Digitales de Elevaciones, este se lleva a cabo 
mayoritariamente sobre capas ráster, tal y como explicamos en el 
capítulo 15. Si disponemos de una capa de elevaciones recogida como 
un conjunto de curvas de nivel (es decir, una capa vectorial), resulta 
conveniente transformar esta y que exista en el conjunto de datos del SIG 
un MDE ráster, mucho más acorde con lo que los usuarios van a requerir. 

• Sistema de coordenadas. Si los datos tienen distintos sistemas de 
coordenadas, será necesario transformarlos a un sistema común, pre- 
ferentemente a aquel que vaya a ser utilizado con más frecuencia para 
la generación de resultados. 

En resumen, el objetivo principal que debemos perseguir al configurar el con- 
junto de datos que van a formar parte de un SIG es lograr que la utilización de 
estos sea lo más sencilla y fluida posible. Un conjunto de datos rico y variado, bien 
estructurado y cuyo empleo no dé lugar a problemas o haga aparecer necesidades 
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adicionales, simplificará más tarde el trabajo con el SIG y será una garantía del 
éxito de su implementación. 

29.3.2. Personas 

Si a lo largo de este libro hemos mencionado en repetidas ocasiones que los datos 
son el elemento imprescindible del sistema SIG, a la hora de implementar y organizar 
este son las personas quienes juegan el papel principal. El desarrollo del sistema SIG 
debe realizarse a partir de los usuarios, ya que la influencia que tienen en los restantes 
elementos es muy superior a la de estos otros. Los usuarios son quienes operan direc- 
tamente con las aplicaciones y quienes además han de tomar decisiones a lo largo de 
un proyecto SIG, por lo que es necesario escuchar sus necesidades y sus opiniones 
antes de implantar un SIG, con el fin de proporcionarles el mejor entorno posible. 

Las consideraciones acerca de los restantes elementos, tales como datos o soft- 
ware, deben matizarse «escuchando» lo que los usuarios pueden decir al respecto. 
El éxito en la implantación de un SIG pasa por tener en cuenta de forma conjunta 
los requerimientos del mayor número de usuarios posible, considerando incluso 
el perfil de futuros usuarios que puedan incorporarse más adelante. 

Resulta erróneo, por ejemplo, adquirir un determinado software basándose 
exclusivamente en las propias características de este, y sin consultar a los futuros 
usuarios si poseen alguna experiencia previa con él o con otro similar. No siem- 
pre la mejor herramienta desde el punto de vista técnico garantiza unos mejores 
resultados al usarla, ya que existen otros factores que afectan a la productividad y 
la calidad de los trabajos que se desarrollen posteriormente sobre esa herramienta. 

Una sencilla encuesta a los usuarios es una herramienta muy valiosa para 
aportar información en este sentido y decantar la elección de la herramienta en uno 
u otro sentido. Igualmente, nos permitirá saber algo más sobre el nivel medio de los 
usuarios, sus preferencias o el tipo de trabajo que desarrollan mayoritariamente. 

Se admite generalmente que el éxito en la implantación de un SIG pasa por 
un modelo de implantación que dé preponderancia a los usuarios como factores 
a considerar. No obstante, este enfoque no es siempre sencillo y no siempre está 
exento de riesgos. Definir las necesidades de los usuarios es uno de los aspectos 
vitales para la implementación de un SIG, pero también uno de los más difíciles 
[392], En ocasiones, por ejemplo, el usuario no necesariamente sabe qué es lo que 
necesita o qué le conviene. Un problema muy habitual en el mundo del SIG es el 
desconocimiento por parte de los usuarios de las verdaderas capacidades que el 
SIG tiene y puede ofrecerles. Estos usuarios son capaces de utilizar un SIG, pero 
el aprovechamiento que hacen de este no es óptimo, ya que ignoran una gran parte 
de su potencia. El hecho de que las aplicaciones SIG sean complejas y dispongan 
de funcionalidades numerosas contribuye a este hecho. 

En este sentido, es importante considerar el papel de los usuarios también con 
posterioridad a la implantación del SIG, es decir, una vez que se ha tomado una 
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decisión acerca de otros elementos como software o datos, y estos ya se encuentran 
operativos. En lo que al software respecta, esto incluye el desarrollo de acciones 
tales como seminarios o presentaciones, que divulguen las capacidades del SIG 
entre los usuarios y les hagan conscientes de lo que pueden lograr con este. 

Otro de los aspectos importantes en el elemento formado por los usuarios 
son las relaciones entre estos. Citábamos como una de las ventajas de una buena 
organización el hecho de que existe un mejor conexión no solo entre los distintos 
elementos del SIG, sino también en cada uno de dichos elementos, entre sus distin- 
tos representantes. Esto es especialmente relevante en el caso de los usuarios, ya 
que la comunicación fluida entre ellos puede evitar muchos problemas y aumentar 
sensiblemente la productividad y la calidad del trabajo. Los usuarios con mayor 
experiencia pueden solucionar problemas a usuarios menos experimentados, acon- 
sejarles en el desarrollo de su trabajo o instruirles en las capacidades del software. 
La creación de comunidades de usuarios activas es una buena señal de una im- 
plantación exitosa de un SIG, y estas comunidades pueden incluso trascender el 
ámbito de una implantación particular de un SIG, extendiéndose hasta cubrir a 
todos los usuarios de una determinada aplicación, o a todos los involucrados en 
un área de conocimiento dada en la que se utilice un SIG. 

Por último, es importante para definir las necesidades de los usuarios saber 
clasificar a estos y conocer su papel en el SIG. Un usuario puede tener funciones 
muy distintas, ya que consideramos como tal a toda persona involucrada en el 
sistema SIG, no exclusivamente a aquellas que directamente realizan el trabajo 
más típico tal como el análisis de datos y la obtención de cartografía a partir de 
ese análisis. Para ver esto, podemos acudir a un ejemplo sencillo. 

Volvamos al caso presentado en el primer capítulo de este libro, relativo a la 
gestión de una masa forestal, y analicemos qué tipos de usuarios podemos encontrar 
y el papel que cada uno de ellos desarrolla en el SIG. 

En un extremo encontramos a las personas encargadas de la toma de decisiones, 
tales como los gestores y miembros de la administración responsable de la masa 
forestal. Estas personas no han de tener necesariamente unos amplios conocimientos 
de SIG, sino tan solo ser capaces de entender los resultados que se generan con este. 
En función de ellos, tomarán decisiones aplicando su experiencia al respecto, que en 
este área sí que debe ser elevada. En una posición similar encontramos a los operarios 
encargados del trabajo de campo y agentes forestales que trabajan directamente 
sobre la masa, y que, en términos del SIG, realizan fundamentalmente una labor de 
recogida de datos. Deben conocer bien el entorno forestal y las técnicas de muestreo 
y toma de datos, pero no es un requisito imprescindible que cuenten con experiencia 
en SIG. Si la recogida se realiza empleando alguna tecnología a tal efecto, o incluso 
algún tipo de SIG sobre una plataforma móvil, deberán tener nociones básicas de 
manejo, pero eso no constituye un conocimiento amplio de los SIG y sus capacidades. 

En el extremo contrario a los anteriores encontramos a aquellos usuarios que se 
encargan de las cuestiones más técnicas del SIG y de corte más informático. Entre 
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ellos están los administradores de las bases de datos, los programadores o los técnicos 
encargados de la digitalización de cartografía. Estos deben tener un amplio conoci- 
miento del software que usan, pero no es necesario que sean expertos en el ámbito 
de aplicación en el que se encuentran. Así, los técnicos que digitalicen cartografía 
deben tener suficientes conocimientos cartográficos y de manejo de la herramienta, 
pero pueden desarrollar su trabajo sin conocer en profundidad aquello que están 
digitalizando (por ejemplo, parcelas de inventario o unidades de gestión del monte). 

Entre estos dos extremos encontramos un diverso abanico de usuarios que 
emplearán de un modo u otro el SIG, y que aplicarán en distinta medida sus pocos 
o muchos conocimientos del ámbito de la gestión forestal, estando especializados de 
forma distinta en ambos campos. Podemos ver cómo todos estos tipos de usuarios 
se caracterizan, pues, atendiendo principalmente a sus capacidades dentro de dos 
ámbitos distintos: el de los SIG y el ámbito propio de aplicación de este (en este 
caso, el de la gestión forestal). En función de esto, [393] define cuatro bloques 
principales de usuarios: 

■ Técnicos informáticos. Con alta especialización en SIG pero escasa en el 
ámbito de aplicación. 

■ Profesionales ocasionales. Gestores y usuarios finales, con conocimientos 
limitados de SIG y alta especialización en el ámbito concreto de aplicación. 

■ Público. Los clientes del servicio que ofrece la organización en que se im- 
planta un SIG, los cuales normalmente no presentan una gran especialización 
en ninguno de los dos bloques mencionados. 

■ Especialistas en la aplicación. Expertos que conocen con detalle el SIG 
y también el campo de aplicación de este. Se incluyen aquí los analistas SIG y 
los cartógrafos, para cuyo trabajo se requiere un alto conocimiento de todos 
los elementos implicados. 

Un resumen distinto de estas ideas acerca de los usuarios de un SIG lo encon- 
trarás en la tabla 29.1, donde puedes ver una definición de las principales labores 
que estos y los perfiles correspondientes a estas. 

Con todo lo anterior, tenemos ya un marco en el que trabajar a la hora de 
implantar un SIG, tratando de no dejar fuera de este a ningún grupo de usuarios 
y adaptándolo a las distintas formas de utilizarlo que estos presentan. 

29.3.3. Software 

Puede pensarse en un principio que el software es el único factor a tener en cuen- 
ta al realizar la implantación de un SIG, pues es la cara visible de ese GIS de cara al 
usuario y al trabajo que este realiza. Sabemos ya, sin embargo, que esa visión simpli- 
ficada en la que la elección de un software es la única decisión relevante a tomar es 
errónea, pero incluso en ese caso, el problema al que nos enfrentaríamos no sería sen- 
cillo. El mercado está lleno de aplicaciones SIG de muy diversas características que 
no hacen precisamente fácil elegir la más adecuada a nuestras necesidades concretas. 
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Actor 

Tareas 

Actores específicos 

Proveedores de datos. 

Generan nuevos datos 
espaciales. 

Son los dueños de los datos 
del sistema. 

Proveen información 

espacial. 

Grupos de investigación 
dentro de la institución. 
Otras entidades interesa- 
das en el mismo espacio 

Administradores de datos. 

Mantenimiento y estandari- 
zación de datos espaciales. 
Mantenimiento de los pro- 
cesos que aseguran eficien- 
cia y estandarización para 
manejar y entregar datos 

Especialistas en SIG y 
programación. 

Usuarios de datos 

Acceso y recombinación de 
datos espaciales Genera- 
ción de nueva información 
geográfica y de bases de 
datos. 

Adición de conocimientos, 
hechos, interpretaciones y 
análisis al sistema. 

Profesionales en GIS y 
geografía. 

Analistas de información 
espacial. 

Planificadores. 

Clientes y usuarios de datos 
fuera de la institución. 

Uso de la información y 
de los datos geográficos 
generados a partir del SIG 
institucional. 

De diversa naturaleza, in- 
teresados en los fenómenos 
espaciales. 


Cuadro 29.1: Labores principales desempeñadas por los usuarios de un SIG (adaptado 
de [394]) 


Más aún, lo más probable es que ninguna de esas aplicaciones, pese a la amplia 
variedad existente, pueda cubrir dichas necesidades, y nos veamos obligados a com- 
binar varias de ellas. Si el entorno de trabajo hacia el que enfocamos la implantación 
de nuestro SIG es amplio, la gama de necesidades que vamos a encontrar resultará 
más extensa, siendo todavía más complejo elegir el software que necesitamos. 

Conocer con detalle el panorama actual del mercado de aplicaciones SIG es 
complejo, pero tener una visión global de sus principales representantes puede ser 
sencillo y muy útil no solo para elegir una aplicación concreta, sino también para 
saber qué podemos esperar al tratar de escoger una herramienta. El del SIG es un 
escenario cambiante donde aparecen muchas novedades continuamente, y donde 
los enfoques cambian a veces de forma notable. 

Aun conociendo qué aplicaciones SIG existen en el mercado y sus características, 


740 


Sistemas de Información Geográfica 


la elección de una que responda a nuestras exigencias puede no ser posible. En ocasio- 
nes, no existiendo una alternativa satisfactoria, puede ser necesario desarrollar ele- 
mentos adicionales a medida de las necesidades existentes, e incluso, en un caso más 
extremo, el desarrollo completo de una aplicación SIG. Como vimos en el capítulo 
21, los SIG en la actualidad se conciben como elementos base muy extensibles, sien- 
do sencillo extenderlos desarrollando únicamente las capacidades que necesitamos, 
y haciendo uso de forma transparente de todas las funcionalidades que ya contienen. 

En lo que respecta a la procedencia del software, encontramos una situación 
parecida a la existente con los datos. Adquirir software es la solución más inme- 
diata y generalmente asequible, aunque en circunstancias particulares es necesario 
producir el software necesario que responda a unos requisitos más específicos. El 
desarrollo de este software puede contratarse como un servicio externo, o bien 
dentro del organismo de trabajo en el que nos encontremos [395]. 

En caso de optar por simplemente utilizar un producto existente en el mercado, 
[15] cita algunas cuestiones que deben plantearse antes de elegir un software SIG, 
entre las que figuran las siguientes: 

■ ¿Qué funcionalidades tiene? 

■ ¿Cumplen esas funcionalidades los requerimientos de mi organismo/equipo 
de trabajo? 

■ ¿Necesito realmente todas esas funciones? 

■ ¿Dispone de un entorno amigable? 

■ ¿Dispone de funcionalidades adicionales para usuarios avanzados? 

■ ¿Puede intercambiar datos con otras aplicaciones usadas en mi organis- 
mo/equipo de trabajo? 

■ ¿Qué documentación existe? 

■ ¿Es posible obtener formación? 

■ ¿Cuánto cuesta? 

■ ¿Puede esperarse que el fabricante siga desarrollando y apoyando este soft- 
ware? 

■ ¿Qué sistema operativo necesita para ejecutarse? 

Como ya se ha mencionado, estas cuestiones deben relativizarse en función 
de otros criterios tratados en este mismo apartado. Los usuarios del software 
condicionan, por ejemplo, lo que entendemos por «entorno amigable», ya que 
usuarios expertos pueden encontrar muy amigable una linea de comandos, mientras 
que otros menos familiarizados con este tipo de interfaces pueden ser incapaces 
de trabajar con ella. En este caso, es incluso probable que el usuario experto sea 
mucho más productivo en esa interfaz de linea de comandos que en otra distinta, 
con lo cual cabe reflexionar acerca de este apartado y tener claro que un mismo 
software puede ser interpretado de formas distintas según las circunstancias. 

Asimismo, si consideramos la posibilidad de desarrollo de elementos adicio- 
nales mencionada anteriormente, es importante tener en cuenta el aspecto relativo 
a la forma de licénciamiento del software, bien sea como software libre o bien 
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como software privativo. Esto condicionará en gran medida las posibilidades de 
modificación y extensión que la aplicación base escogida nos ofrezca, y por tanto 
también la idoneidad de una u otra decisión al respecto. 


29.3.4. Hardware 


Sin dejar de ser relevante, el hardware plantea menos problemas que otros ele- 
mentos a la hora de implementar un SIG. Pese a ser un elemento fundamental, las ac- 
tuales capacidades de los ordenadores y el cada vez menor coste de la tecnología han 
hecho más sencilla la elección de equipos adecuados dentro de un presupuesto dado. 

El hardware es, además, el elemento en el que las particularidades del SIG 
tienen menos influencia, al menos en lo que a los ordenadores como tales respecta. 
Los requisitos de un SIG en este aspecto no son muy distintos de lo que cabe 
esperar en muchas otras aplicaciones de distinta índole hoy en día. 

Estudios como [396] muestran que las características de los equipos empleados 
para el trabajo con SIG dentro de un organismo o grupo de trabajo dependen 
principalmente del tamaño de la comunidad de usuarios. Es decir, que por encima 
de otras consideraciones tales como qué hacen esos usuarios o cómo lo hacen, el 
factor más relevante es cuántos usuarios existen. Esto parece lógico si se piensa que 
un mayor número de usuarios va a implicar una mayor cantidad de datos y muy 
posiblemente unas mayores necesidades de proceso, circunstancias que favorecen 
el empleo de estaciones de trabajo de mayor potencia, en lugar de o junto a los 
habituales ordenadores personales. 

La parte más específica dentro de un SIG en lo referente a hardware la encontra- 
mos en los periféricos. Como ya vimos en el capítulo 6, algunas tareas tales como la 
creación de datos requieren equipos especiales como por ejemplo tabletas digitaliza- 
doras. Mientras que un puesto de trabajo para un usuario que realice un trabajo de 
análisis de datos es sencillo de instalar y requiere, en términos de hardware, poco más 
que un equipo estándar, una estación fotogramétrica digital tienen unos requisitos 
más específicos. En casos particulares como este, la oferta suele ser mucho más redu- 
cida y, con frecuencia, los proveedores de software y hardware son el mismo y no ofre- 
cen ambos productos por separado, sino formando parte de paquetes ya definidos. 

Otro aspecto particular del hardware SIG aparece en la generación de salidas. 
La creación de mapas impresos, generalmente de gran tamaño, exige el empleo 
de medios de impresión de gran formato, menos comunes y con un coste mayor 
que el de impresoras y plotters comunes. 
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29.4. Distintos niveles de organización. Organización 
de un proyecto SIG 

Cuando hablamos de organización de un SIG, entendemos que este concepto se 
aplica, como venimos viendo, a los elementos que componen el sistema, tratando de 
mejorar la labor de cada uno de ellos y las relaciones con los restantes. Esto afecta 
al SIG como sistema complejo, desde el momento de su implantación (es decir, 
desde que se crea y se pone en uso dentro de un contexto dado) , y durante una serie 
de trabajos o acciones desarrolladas a lo largo de su vida. Esta organización se desa- 
rrolla sobre el total de lo que vamos a encontrar en el SIG durante esa vida, es decir, 
teniendo en cuenta toda la gente que va a operar con el SIG o todos los datos que es 
posible que se almacenen, entre otras consideraciones. Se debe pensar, igualmente, 
en todos los distintos proyectos que van a llevarse a cabo, cada uno de los cuales 
planteará unas necesidades específicas y condicionará así el diseño global del SIG. 

No obstante, existe también una necesidad organizativa que afecta a cada uno de 
esos proyectos, y que guarda gran importancia si deseamos concluir estos de forma 
exitosa. Los proyectos SIG no son distintos de otro tipo de proyectos tales como el 
desarrollo de un software, la construcción de un edificio o la creación de una empresa, 
y necesitan un análisis previo, unos planteamientos de partida y una serie de 
procedimientos estructurados para ir completando con garantías las distintas etapas 
del proyecto. En el caso de un proyecto SIG, estas etapas vienen caracterizadas por 
el empleo de información geográfica y el planteamiento de un problema también 
con una componente geográfica, a resolver mediante una serie de procesos de 
análisis y operaciones tales como las que hemos ido viendo en capítulos anteriores. 

La ingeniería de proyectos provee un nutrido conjunto de técnicas para la 
elaboración de estos, las cuales son de aplicación en los más diversos contextos, 
incluido el de los SIG. Herramientas como el análisis DAFO para la realización 
de estudios de idoneidad, o los diagramas de Gantt para controlar el desarrollo del 
proyecto a lo largo del tiempo, son solo algunas de las más populares para cubrir 
las necesidades de planificación de un proyecto de características cualesquiera. No 
es el objetivo de este texto el detallar estas metodologías, que quedan todas ellas 
fuera de su alcance temático. El lector interesado puede encontrar una interesante 
introducción a la gestión de proyectos en [397]. 

Es de interés, no obstante, mencionar la multidisciplinaridad de los proyectos 
SIG como una característica básica a la que debe prestarse atención. Los distintos 
tipos de usuarios que vamos a encontrar dentro de un proyecto SIG conforman 
un panorama muy variado, con unas funciones que, en ocasiones, y especialmente 
en proyectos de menores dimensiones, no se reparten adecuadamente, recayendo 
algunas de ellas en usuarios no especializados. Aislar adecuadamente las responsa- 
bilidades y conocimientos necesarios para jugar cada papel dentro de un proyecto 
SIG es importante de cara a lograr que todas las partes de ese proyecto se completan 


de manera óptima. 


29.5. Resumen 

Implantar un SIG es una tarea compleja de la que depende posteriormente el 
éxito de dicho SIG. Organizar y coordinar adecuadamente todos los elementos de 
un SIG es una labor básica para llevar a cabo una correcta implantación. Hemos 
visto en este capítulo cómo considerar cada uno de esos elementos tanto por sí 
mismos como en relación con los restantes, y de qué forma plantearse lo que cada 
uno de ellos representa antes de tomar decisiones de cara a la implantación de SIG. 
Entre ellos, los usuarios suponen el elemento de mayor importancia, alrededor del 
cual debe centrarse el proceso de implantación. 

Es necesario igualmente organizar los proyectos SIG y tener en cuenta las parti- 
cularidades de estos como proyectos, para así poder aplicar las técnicas habituales 
de gestión de proyectos de forma más específica. La característica particulares que 
define a un proyecto SIG en comparación con otro tipo de proyectos es su alta 
multidisciplinaridad. 
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Capítulo 30 


Infraestructuras de Datos Espaciales 


Luaces, Miguel; Olaya, Víctor; Fonts, Oscar 

Las Infraestructuras de Datos Espaciales (IDE) son en la actualidad el elemento básico 
para el aprovechamiento de la información geográfica a nivel global. Desde su aparición, 
han supuesto un cambio conceptual en el ámbito SIG, y su importancia en el contexto 
actual es innegable. 

En este capítulo se desarrollan las principales características de una IDE, sus elementos, 
su historia y los aspectos que se tienen en cuenta para establecer con éxito una de ellas. 


30.1. Introducción 

Alrededor de un SIG se movilizan elementos técnicos a varios niveles, y con- 
fluyen diferentes equipos de trabajo. Así, además de los aspectos técnicos, es 
importante plantearse los aspectos organizativos, funcionales y humanos. Si plan- 
tearse estos aspectos es importante dentro de una misma organización, se convierte 
en algo fundamental cuando confluyen múltiples organizaciones a varios niveles. 

Si observamos las diferentes comunidades de usuarios de SIG, observaremos 
que, si todas esas comunidades se coordinan y encuentran elementos comunes en 
que apoyarse, pueden surgir abundantes intereses comunes que beneficien a todas 
ellas, evitando la duplicidad de tareas. Así pues, cada vez es más habitual que en 
los proyectos SIG no sólo esté implicada una organización, sino que se trabaje de 
forma distribuida y colaborativa entre varias. 

A este hecho hay que sumar que uno de los principales productores de infor- 
mación geográfica son los organismos públicos, desde el nivel nacional hasta el 
regional, y que esos datos van a ser utilizados por múltiples organizaciones y gran 
cantidad de usuarios de SIG. 

Las pautas organizativas que se definirían dentro de una organización deben 
traducirse a este nivel superior en políticas y normativas que establezcan un 
contexto general adecuado. En este, todos los actores implicados en el trabajo con 
información geográfica, desde su creación hasta su uso final, pueden coordinarse 
y beneficiarse del trabajo mutuo, así como, especialmente, del desarrollado por 
las administraciones en su faceta de productores de datos geográficos. 

Sin una coordinación así, el aprovechamiento de los SIG y de la información 
geográfica no sería todo lo completo que cabría desear. El número de proyectos 
que no se desarrollan o que salen adelante en condiciones no óptimas por falta de 
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datos es elevado. Sin embargo, el problema subyacente no es siempre la falta en 
sí de datos, sino muchas veces la imposibilidad de obtener esos datos o, incluso, 
de saber que estos existen. Es decir, que el problema no es habitualmente de tipo 
técnico, sino de tipo organizativo, político y social. 

Es en esta situación de escasa coordinación donde surgen las Infraestructuras 
de Datos Espaciales para dar respuesta a las necesidades de organización glo- 
bal en lo referente a la información geográfica, y en la que se han desarrollado 
progresivamente hasta nuestros días. 


30.2. La aparición de las IDE 

Que la información geográfica es de gran importancia para proyectos de todo 
tipo es algo de sobra conocido. No obstante, el reconocimiento de esa importancia y 
de la necesidad de una correcta gestión de dicha información para poder solucionar 
problemas de diversa índole no aparece como tal hasta fechas recientes. Una de tales 
fechas, la cual puede citarse como momento decisorio en el desarrollo de las IDE, 
es la conferencia de las Naciones Unidas sobre medio ambiente y desarrollo que 
tuvo lugar en en Río de Janeiro en 1992. Entre los muchos temas a debate en esta 
reunión, uno de especial relevancia fue el papel de la información geográfica para 
tratar los problemas acerca de los cuales se debatía (protección medioambiental, 
cooperación internacional, desarrollo, etc.). Quedó claro en aquel momento que 
establecer mecanismos para afrontar esos problemas pasaba necesariamente por 
instaurar de forma paralela mecanismos que permitieran aprovechar mejor la 
información geográfica y lograr una mayor coordinación entre las organizaciones 
estatales encargadas de su manejo. En otras palabras, en una reunión de nacio- 
nes que buscaban coordinarse para solucionar asuntos medioambientales, estas 
concluyeron unánimemente que un aspecto crítico era coordinarse en lo referente 
a información geográfica, pues esta era una herramienta básica para el desarrollo 
de cualquier actividad en ese ámbito. Y además, que esta coordinación debía 
extenderse dentro de cada país descendiendo desde el nivel estatal hasta el nivel 
más bajo en que se produzca información geográfica. 

En el Programa 21, promulgado en esa conferencia, se incluyen los dos siguientes 
principios: 

■ Principio 4: A fin de alcanzar el desarrollo sostenible, la protección del medio 
ambiente deberá constituir parte integrante del proceso de desarrollo y no 
podrá considerarse en forma aislada. 

■ Principio 10: El mejor modo de tratar las cuestiones ambientales es con la 
participación de todos los ciudadanos interesados. Toda persona deberá tener 
acceso adecuado a la información sobre el medio ambiente de que dispongan 
las autoridades publicas. 

Entre esa información a la que los ciudadanos deben tener un acceso adecuado 
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se encuentra, en lugar preponderante, la información geográfica, básica como ya 
sabemos para la realización de cualquier estudio o análisis del medio. 

Como respuesta a la redacción de estos principios, comienzan a surgir las pri- 
meras iniciativas de carácter nacional encaminadas a lograr los objetivos anteriores. 
Previamente a este momento, una coordinación así era algo por completo inexis- 
tente. Cada organización, ya fuera una agencia estatal o una empresa, producía la 
información que pudiera necesitar y no buscaba favorecer la difusión de esta. Como 
consecuencia de ello, se perdía la oportunidad de aprovechar el esfuerzo realizado, 
y cualquier otro trabajo que pudiera beneficiarse de esa información geográfica 
debía desarrollarse sin ella, o bien realizando un nuevo esfuerzo de creación, con 
el consecuente gasto económico. En resumen, una situación en absoluto óptima. 

El hecho de que la situación relativa a la información geográfica no era idónea 
era ya conocido. Aunque no existieran iniciativas formales para atajar el problema, 
este estaba ya plenamente identificado. En 1987, el comité Chorley, del Departa- 
mento de Medioambiente de Estados Unidos, concluyó que «las barreras políticas 
e institucionales que restringen actualmente el uso de los SIG deben ser supera- 
das. Esto incluye problemas de incompatibilidad por diferencias de definición y 
formatos, así como restricciones al acceso y adquisición de los propios datos.» 

En particular, se identifican los siguientes puntos problemáticos: 

■ Calidades muy diferentes y sin especificar. 

■ Disparidad de escalas y formas de representación. 

■ Políticas de precios que suponen, en la práctica, hacer inaccesibles los datos 
espaciales. 

■ Un mercado sin regular: distintos proveedores con productos similares, 

■ Falta de estándares de intercambio. Cada proveedor suministra la informa- 
ción en el formato de archivo de su programa (propietario). 

Desde el momento en que se establece como crucial el papel de la información 
geográfica, comienzan a desarrollarse elementos, tanto técnicos como políticos y 
administrativos, cuyo objetivo principal es disminuir o eliminar la presencia de 
situaciones similares a la anterior, haciendo que la información geográfica esté 
disponible de forma sencilla para todos los usuarios que puedan necesitarla, y 
favoreciendo así su aprovechamiento en la mayor medida posible. Estos elementos 
en su conjunto forman lo que desde entonces se ha dado en llamar Infraestructura 
de Datos Espaciales, y que paulatinamente los distintos organismos públicos han 
ido instaurando en sus territorios hasta el día de hoy. 

El desarrollo de iniciativas de este tipo es una constante desde ese momento, 
conformándose así de forma progresiva el panorama actual de la producción y uso 
de información geográfica. Veremos algunas de esas iniciativas con más detalle en 
este y en el próximo capítulo. 
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30.3. ¿Qué es una IDE? 

Podemos definir una IDE como un conjunto de datos espaciales, tecnología, nor- 
mas y planes institucionales, todos ellos encaminados a facilitar la disponibilidad 
y el acceso a dichos datos espaciales. 

A diferencia de los planteamientos anteriores a la aparición de las IDE, en los que 
se consideraba a los datos como elementos independientes que podían jugar su papel 
en el entorno SIG sin necesidad de establecer políticas o acuerdos referidos a ellos, el 
desarrollo de las IDE trae consigo un nuevo planteamiento en el que los datos necesi- 
tan elementos adicionales para ser verdaderamente productivos. Una Infraestructu- 
ra de Datos Espaciales es, por tanto, mucho más que datos. Como indica [398] , una 
IDE incluye, además de los datos y atributos geográficos, documentación suficiente 
(los denominados metadatos ) , un medio para descubrir, visualizar y valorar los datos 
(catálogos y cartografía en red) y algún método para proporcionar acceso a los datos 
geográficos (generalmente, Internet es el medio principal). Además, debe haber 
servicios adicionales o software para permitir aplicaciones de los datos. Por último, 
para hacer funcional una IDE, también debe incluir los acuerdos organizativos nece- 
sarios para coordinarla y administrarla a escala regional, nacional y transnacional. 

Los conceptos básicos que podemos extraer de esta definición son los siguientes: 

■ Información contenida. Una IDE es más que un conjunto de datos espa- 
ciales que se ofrecen para ser utilizados por más usuarios que los concebidos 
originalmente. Una IDE debe contener también servicios para descubrir 
qué datos hay disponibles (servicio de catálogo) , servicios para acceder a 
la información geográfica y a la cartografía, y finalmente metadatos que 
describan los conjuntos de datos y los servicios disponibles. 

■ Utilización de estándares. Los servicios y tecnologías utilizados en una 
IDE deben basarse en estándares aceptados internacionalmente para permitir 
la interoperabilidad a nivel técnico entre los sistemas de la IDE. 

■ Establecimiento de acuerdos. El aspecto más importante de la IDE es el 
establecimiento de acuerdos entre los actores para la utilización de tecnolo- 
gías y servicios compatibles y para la unificación de los modelos de datos de 
cada nivel de la IDE, de forma que se permita la combinación de los conjuntos 
de datos espaciales y la interacción de los servicios sin intervención manual 
repetitiva, obteniéndose un resultado coherente. Estos acuerdos también dis- 
minuyen los costes que conlleva la integración de la información proveniente 
de diversas fuentes, y eliminan la necesidad del desarrollo paralelo de instru- 
mentos para el descubrimiento, intercambio y explotación de datos espaciales. 
Por ejemplo, y como veremos con detalle más adelante, INSPIRE [399] es la 
directiva europea que se ha establecido como marco de políticas, disposiciones 
institucionales, tecnologías, datos y personal de todas las IDE en la Unión Eu- 
ropea. INSPIRE dicta una serie de normas que son de obligado cumplimiento 
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para las IDE europeas, pudiendo cada país miembro establecer normas más 
restrictivas para su ámbito siempre que no entren en conflicto con INSPIRE. 

30.3.1. Estructura de una IDE. Niveles. 

Las IDE surgen para coordinar la producción cartográfica a nivel global y su uso 
por todo tipo de usuarios. No obstante, no resulta práctico ni organizativamente 
viable gestionar tal cantidad de trabajo e información a un único nivel, siendo 
necesario delegar en distintos niveles y establecer una estructura organizativa para 
distribuir las responsabilidades y tareas. Esto da lugar a una estructura en forma 
de red en la que se distinguen una serie de nodos interconectados, cada uno de 
los cuales lo administra un determinado organismo responsable. Las relaciones 
existentes dependerán de la posición y nivel del nodo en cuestión, así como el tipo 
de organismo responsable de este. 

En primer lugar, se puede clasificar un nodo IDE en función de la posición en 
la jerarquía administrativa que ocupe el organismo responsable del nodo. Esto 
divide los nodos en niveles que van desde desde la IDE global en el nivel superior 
hasta las IDE locales y las IDE corporativas en el nivel inferior. 

Las responsabilidades en cada nivel difieren de forma notable, especialmente en 
lo que respecta al detalle de la información geográfica. A medida que descendemos 
en la jerarquía, el nivel de detalle aumenta, al mismo tiempo que el área geográfica 
gestionada por el nodo disminuye. La escala a la que se recoge la información 
varía para hacer más eficaz el manejo de la información, de tal modo que los nodos 
superiores delegan en los inferiores la obtención de información geográfica a una 
escala de mayor detalle que la establecida como límite para ellos. Se trata de que 
cada nodo opere en una escala adecuada para la extensión de territorio que gestiona. 

A modo de ejemplo, la IDE de España cubre todo el territorio de España pero 
no puede recoger la información a una escala más detallada que 1:25000. La IDE 
de Galicia (una comunidad autónoma de España) cubre un territorio menor pero 
puede recoger la información a una escala de 1:5000. Finalmente, la IDE de un 
municipio de Galicia cubre un territorio mucho más pequeño pero puede recoger 
la información con mucho más detalle. 

Entre los nodos de la IDE existen dos tipos de relaciones: las relaciones vertica- 
les y las relaciones horizontales. Las relaciones horizontales son las que se producen 
entre nodos de la IDE del mismo nivel. Un ejemplo claro de este tipo de relación es la 
que se produce para compartir información fronteriza de manera que sea continua 
y coherente. Por otra parte, las relaciones verticales son las que se producen entre 
nodos de la IDE de distinto nivel. Un ejemplo de este tipo de relación es el caso en 
el que un nodo de nivel superior consulta un nodo de nivel inferior para responder 
a una consulta que no puede responder con su propia información, o cuando un 
nodo de nivel superior recopila información de los nodos inferiores para agregarla 
y generar nueva información. Otro ejemplo de este tipo de relación ocurre cuando 
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un nodo de nivel superior impone requisitos a los nodos inferiores para hacer que 
su información o su modo de funcionamiento sea coherente. 

30.3.2. Componentes de una IDE 

Pueden distinguirse los siguientes componentes en una IDE: 

■ Datos. Antes de la aparición de las IDE, los datos se encontraban dispersos 
y fragmentados en distintas administraciones y/o empresas. Esto provocaba 
dos problemas: por un lado se duplicaban esfuerzos en la captura y man- 
tenimiento de la información geográfica, y por otro lado era complicado 
encontrar cartografía apropiada para un trabajo porque había que solicitarla 
a distintos organismos siguiendo distintos trámites burocráticos y debía 
comprobarse que la información obtenida fuera coherente. 

Las IDE evitan estos problemas mediante la aplicación de dos técnicas. En 
primer lugar, se obliga a capturar y mantener la información geográfica una 
única vez allí donde puede hacerse de modo más efectivo. De esta forma, la 
cartografía que se esté utilizando será siempre la mejor para cada caso y el 
coste de captura y mantenimiento se minimizará. En segundo lugar, las IDE 
obligan a compartir la información geográfica mediante servicios de datos 
basados en estándares (ver punto siguiente) , lo que permite que el acceso a la 
información se pueda hacer de forma interoperable utilizando herramientas 
informáticas de análisis y visualización. 

Otro pilar fundamental de las IDE son los metadatos, que describen a los 
propios datos espaciales y nos aportan información adicional acerca de ellos. 
Resultan imprescindibles para conocer siempre qué cartografía estamos 
usando, y son el único medio del que se dispondrá para poder seleccionar qué 
cartografía se ajusta mejor a nuestro caso de uso. Los metadatos se describen 
en el capítulo 31. 

■ Estándares. Es indispensable para el buen funcionamiento de una IDE 
que sea interoperable tanto a nivel técnico como a nivel semántico. La inter- 
operabilidad a nivel técnico consiste que los participantes en el proceso de 
comunicación utilicen los mismos lenguajes, lo que implica llegar a acuerdos 
para la utilización de los mismos formatos y servicios de datos basados 
en estándares aceptados internacionalmente. La interoperabilidad a nivel 
semántico consiste en que la información compartida sea coherente en cuanto 
a significado, lo que implica que los organismos lleguen a acuerdos en cuanto 
a modelos conceptuales de esa información. En el capítulo 32, veremos qué 
organizaciones internacionales son las encargadas de dictar los estándares 
requeridos para el intercambio de información geográfica, así como las prin- 
cipales especificaciones que ya están en uso y disponibles para su utilización. 

■ Políticas. El apoyo político es fundamental para el correcto desarrollo de 
las IDE, ya que el mayor esfuerzo de captura y mantenimiento de informa- 
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ción geográfica se realiza en el sector público. Por ello, las políticas que el 
sector público determine con respecto a su mantenimiento, recolección y uso 
son las que mayor impacto tienen sobre la IDE. No se puede, no obstante, 
olvidar al sector privado, ya que es uno de los más interesados en el uso de 
la información proporcionada por una IDE. 

■ Redes accesibles. Un sistema de información que ignore la gran importan- 
cia de Internet hoy en día está condenado al fracaso. En el campo de las IDE 
es necesario que existan redes accesibles para los usuarios y que estas redes 
soporten el tráfico producido cuando un usuario realiza una petición a un 
servidor y este le responde con la información geográfica solicitada. La red 
es el medio en el que la IDE se desarrolla, y gracias al cual puede ser efectiva. 

■ Herramientas de consulta y descubrimiento de datos. Como ya he- 
mos mencionado, los problemas que pueden aparecer en relación con los datos 
pueden deberse a una carencia de estos o al hecho de no estar disponibles, pero 
también a la dificultad de encontrarlos y de ser consciente de que esos datos 
existen en algún lugar. Si Internet es el medio para difundir la información 
geográfica, nos encontramos ante el mismo problema que con otros tipos de 
información: encontrar lo que buscamos en la enorme colección de datos que 
existen. Encontrar una página Web en Internet sin la ayuda de alguno de los 
buscadores que habitualmente empleamos es una tarea prácticamente impo- 
sible. Del mismo modo, cuando un organismo publica sus datos debe proveer 
medios para navegar en esos datos y buscar aquel que deseamos obtener. Estos 
medios conforman lo que se conoce como catálogos. Veremos en una sección 
posterior dentro de este capítulo algunas ideas más detalladas acerca de ellos. 

■ Usuarios. Uno de los principales pilares dentro de una IDE son los usuarios, 
ya que solo si una IDE cubre sus necesidades, estos aceptarán esta nueva 
forma de trabajar y las IDE se mantendrán y evolucionarán. Por lo tanto, es 
importante conocer quiénes son los usuarios potenciales de cada una de las 
IDE y las necesidades que van a tener para poder definir los roles e identificar 
y evitar conflictos de interés entre usuarios. Esto permitirá conseguir el 
máximo nivel de satisfacción de los usuarios de la IDE. 

Es fácil identificar en los puntos anterior una buena parte de los elementos que 
mencionamos en el capítulo dedicado a la implementación de un SIG, ya que, en 
buena parte, el establecimiento de una IDE y la implantación de un SIG comparten 
aspectos comunes. 

30.3.3. Actores de una IDE 

Los actores involucrados en el funcionamiento de una IDE son varios. En 
primer lugar se encuentran los usuarios de la IDE que son los que van a determinar 
su éxito o su fracaso. Dentro de los usuarios podemos considerar distintos tipos: 
administraciones públicas que necesitan la información para realizar sus tareas (por 
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ejemplo las áreas de urbanismo de los municipios, o los organismos de gestión de las 
cuencas hidrográficas), empresas que pueden usar la información para sus negocios 
(por ejemplo empresas de elaboración de planes urbanísticos), universidades y 
centros de investigación, o personas individuales. Todos estos tipos de usuarios 
deben estar contemplados en la IDE ya que el éxito de la misma radica en cubrir 
las necesidades del mayor número posible de usuarios. 

De forma más detallada, [400] divide los usuarios según su perfil en los siguientes: 

■ Usuario básico. Utiliza las herramientas básicas tales como un visor Web. 

■ Usuario avanzado. Utiliza herramientas y aplicaciones específicas no dis- 
ponibles para el público general, ya sea a través de la Web o como aplicaciones 
locales. 

■ Usuario de negocio. Accede a los datos de la IDE desde aplicaciones 
externas, para combinarlo con otros fuera de la IDE y realizar algún tipo 
de negocio en base al conjunto. 

■ Usuario consultor. Está autorizado a acceder a datos restringidos de una 
temática específica. 

■ Usuario editor. Encargado de mantener un subconjunto de datos existentes 
en la IDE. 

■ Usuario gestor. Gestiona determinados servicios proporcionados por la 
IDE, por ejemplo un servicio de mapas temáticos concreto. 

■ Administradores. El responsable final de mantener la infraestructura y 
dar soporte técnico a los restantes usuarios. 

A medida que descendemos en esta clasificación, aumenta la especialización 
al tiempo que disminuye el número de usuarios que pertenecen a cada una de las 
clases definidas, tal y como se recoge esquemáticamente en la figura 30.1 

Además de los usuarios, otros actores involucrado en una IDE son los orga- 
nismos internacionales de creación de estándares, en concreto la organización de 
estandarización internacional ISO con sus miembros nacionales, el Open Geospatial 
Consortium (OGC) y el World Wide Web Consortium (W3C). Estos organismos 
definen las normas y estándares que formarán la base tecnológica de la IDE y que 
permitirán su interoperabilidad. 

Junto a los anteriores, encontramos al responsable particular de cada nodo 
IDE. Este responsable puede ser una administración pública, una empresa, una 
universidad, un centro tecnológico u otro tipo de organismo que se hace responsable 
de la administración del nodo IDE y de establecer los estándares que se deben 
cumplir dentro de su ámbito, así como normas o recomendaciones adicionales. A 
modo de ejemplo, para la IDE de España el responsable es el Instituto Geográfico 
Nacional, para la IDE de Galicia el responsable es el Sistema de Información 
Territorial de Galicia y para la IDE de la provincia de A Coruña el responsable 
es la Diputación de A Coruña. 

De entre todos los responsables que podemos encontrar en el conjunto de 
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Función 

Perfil usuario 

Administración y soporte técnico 

Administrador 

Mantenimiento de servicios 

/ Usuario gestor \ 

Mantenimiento de datos espaciales 

Usuario editor 

Acceso a datos temáticos restringidos 

Usuario consultor 

Integración de datos espaciales en 
aplicaciones externas a la IDE 

Usuario de negocio 

Análisis y consultas espaciales 
complejas 

Usuario avanzado 

Acceso a funcionalidades simples 

predefinidas *• 

Usuario básico 


Figura 30.1: Clasificación de usuarios de una IDE (según [400]) 


nodos de una IDE, las Agencias Cartográficas Nacionales resultan especialmente 
relevantes, por las siguientes razones [401]: 

■ Son responsables de los registros cartográficos en el dominio público y desem- 
peñan un papel fundamental en el desarrollo de las IDE. 

■ Son las instituciones que deben impulsar la puesta en marcha de estánda- 
res y establecer las bases que permitan el intercambio de información y la 
creación de geoportales, así como de los acuerdos jurídicos e institucionales 
relacionados con las IDE. Ponen en marcha plataformas de carácter público 
junto con otros colaboradores de las IDE para estimular la implementación 
de las IDE en los programas y procesos nacionales y de gobierno. 

■ Establecen los acuerdos institucionales para la regulación de las IDE y j uegan 
un papel de liderazgo en la toma de decisiones al nivel del gobierno central. 

■ Juegan un papel importantísimo enlazando la comunidad profesional con 
los responsables políticos. 

Finalmente, consideramos también como actores al resto de nodos de la IDE, 
ya que se debe alcanzar la coherencia de la información evitando la duplicidad de 
esfuerzos. 


30.4. Algo más sobre catálogos 

Los catálogos son la parte visible de la IDE, ya que proporcionan la puerta de 
entrada a los datos de esta y están pensados para simplificar la labor de encontrar 
y obtener los datos necesarios para cada usuario. Otros elementos de las IDE 
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como metadatos o estándares son tratados en capítulos independientes dentro de 
esta parte del libro. Sin llegar a requerir un capítulo específico, los catálogos no 
obstante son piezas imprescindibles sobre las que es necesario profundizar, por 
lo que en este apartado describiremos con algo más de profundidad su papel y sus 
características como partes clave de una IDE. 

El catálogo permite al usuario navegar de forma eficaz por la información 
contenida en una IDE, bien sea en uno de sus nodos de forma aislada o bien en 
el conjunto de la red de nodos que forman la IDE. Los nodos, como ya sabemos, 
deben estar conectados y relacionados, y es en virtud de esa conexión y gracias 
al uso de lenguajes comunes (estándares) que pueden comunicarse y compartir su 
información. De este modo, un catálogo puede ofrecer los datos contenidos en el 
nodo en el que se encuentra, pero también «preguntar» a otros nodos y devolver al 
usuario una respuesta que tenga también en cuenta los datos de esos otros nodos. 
Como vimos en el capítulo 23, esa respuesta a consultas es uno de los servicios que 
pueden ofrecerse basados en información geográfica. 

El catálogo dispone de una interfaz, que es la que el usuario emplea para 
plantear sus búsquedas y obtener respuestas. Esta interfaz se localiza normalmente 
en el portal de acceso al catálogo, y proveen el acceso más directo a los contenidos 
de la IDE. Estos contenidos no se limitan exclusivamente a los datos, ya que pueden 
incluir servicios de distintos tipos (recordemos que, según vimos en el capítulo 23, 
lo datos pueden servirse de varias formas), incluyendo servicios que no se basen 
directamente en los datos de la IDE, tales como procesos. 

En la figura 30.2 puede verse un ejemplo de una interfaz de acceso a un catálogo. 



Figura 30.2: Interfaz de acceso al catalogo de la IDEE 1 
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Cuando nos referimos a un usuario del catálogo, este no ha de ser necesa- 
riamente una persona, y no ha de «ver» la interfaz dispuesta para el acceso. El 
catálogo puede ser consultado por, por ejemplo, otro ordenador, ya que expone 
sus capacidades como un servicio más, y eso es lo que permite que desde un nodo 
de la IDE se puedan realizar consultas sobre nodos distintos. La única condición 
para que esto suceda es que los nodos puedan entenderse entre sí en un lenguaje 
común. Para ello existen los estándares, que se han mencionado ya como parte 
de la IDE y que veremos más extensamente en el capítulo 32. 

De otro modo, podemos entender al catálogo como el bibliotecario que nos 
proporciona acceso a los documentos de una biblioteca. Es a él a quién debemos 
dirigirnos para obtener uno de sus documentos, pero, en caso de que la biblioteca no 
disponga de lo que buscamos, puede llamar a otras bibliotecas y preguntar en ellas 
e incluso, si existen acuerdos de préstamo, facilitarnos la obtención del documento 
sin necesidad de que tengamos que acudir personalmente a la biblioteca donde se en- 
cuentra. Puesto esto en el contexto de Internet y con información geográfica digital 
en lugar de documentos físicos, tenemos una descripción acertada del papel de los ca- 
tálogos como herramientas para el descubrimiento y obtención de esa información. 

Se suele emplear el término harvesting 2 para indicar la capacidad de un nodo 
para recoger la información de otros y poder así responder a peticiones teniendo 
en cuenta esa información ajena. Si los nodos soportan este tipo de operaciones, es 
posible sincronizar los metadatos entre ellos, de forma que cada nodo del catálogo 
se enriquece con los restantes sin que ello suponga una carga extra de organización 
y mantenimiento de metadatos. 

La figura 30.3 muestra un esquema de lo que la actividad de un usuario sobre 
un catálogo supone en otros elementos de la IDE, y cómo estos se relacionan a la 
hora de dar respuesta a su consulta. 

Viendo que los distintos nodos de una IDE están relacionados y bien comunica- 
dos, y que de igual modo lo han de estar sus catálogos, un aspecto importante en 
relación a estos últimos es, sin duda, la forma en que se relacionan. Cabe pensar que, 
si bien es necesario dividir todo el trabajo de gestión de datos de una IDE en una 
serie de nodos para repartir las tareas a distintas escalas y lograr una estructura 
óptima, esto mismo no es estrictamente necesario en el caso de los catálogos. Es 
decir, podrían tenerse los datos divididos entre los distintos nodos, cada uno de los 
cuales permitiera el acceso a suyos datos mediante los correspondientes servicios, 
y tener un único catálogo que contuviera todos los metadatos y un único portal de 
acceso a esos metadatos. Sin duda, esto facilitaría el trabajo de buscar cualquier 
información geográfica, lo cual se haría siempre a través de un único portal. Sin 
embargo, tal centralización de actividades presenta muchas dificultades. Entre 
ellas, encontramos las siguientes: 

■ Exceso de datos. Algunos nodos son muy voluminosos, con literalmente 

2 del inglés to harvest: cosechar, recolectar 
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Figura 30.3: Diagrama de interacción que muestra la utilización básica de servicios 
de catálogo y los elementos de IDE relacionados desde un punto de vista de un usuario 
(adaptado de [398]) 


millones de elementos. Agrupar los metadatos correspondientes a todos 
ellos resultaría en un volumen de datos excesivo, que colapsaría el punto de 
entrada al catálogo. 

■ Actualización más difícil. Los metadatos son dinámicos, actualizándose en 
muchos casos con gran frecuencia. Gestionar la actualización de todos ellos 
desde un nodo central no resulta práctico, y complicaría sumamente la labor 
de los encargados de mantener los metadatos. 

A lo anterior hay que sumar las razones particulares que cada nodo puede 
tener para preferir encargarse él mismo de la gestión de todos los elementos, 
incluido el catálogo. Entre ellas podemos encontrar las ventajas que proporciona 
la independencia del nodo, pudiendo establecer sus propias regulaciones de acceso 
o enfocando el descubrimiento de datos de la forma que resulte más ventajosa al 
organismo responsable. 

Aunque los nodos se comuniquen entre sí y puedan entenderse, no necesaria- 
mente deben compartir la información con un idéntico nivel de detalle. Por ejemplo, 
para la descripción de sus datos a través de metadatos, existen diversos estándares 
adaptados al tipo de dato geográfico de que se trate y al uso para el que este ha sido 
creado. Los nodos usarán aquel que consideren más conveniente en cada caso. La 
existencia de un único catálogo haría imposible esa variabilidad, imponiendo una 
excesiva homogeneización que en la práctica sería más perjudicial que beneficiosa. 
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Por lo anterior, el repositorio de datos y metadatos que forman parte de una 
IDE debe tener una naturaleza distribuida en todos sus elementos, siendo más 
ventajoso operar de ese modo desde la mayoría de puntos de vista. 


30.5. Claves para el éxito 

La creación exitosa de una IDE no depende únicamente de disponer de los 
elementos que la forman y de establecer las relaciones entre elementos y actores. Al 
igual que en la implantación de un SIG, existen circunstancias adicionales que deben 
considerarse para lograr que la IDE cumpla sus objetivos, y de las cuales depende su 
éxito. Por desgracia, no todos los intentos de creación de una IDE que se han llevado 
a cabo desde la aparición de estas han sido igual de exitosos, y se han cosechado al- 
gunos fracasos notables. La experiencia de estos casos, junto con aquellos que sí han 
logrado plenamente sus objetivos, nos enseña que las características más importan- 
tes que una IDE ha de reunir para poder funcionar exitosamente son los siguientes: 

■ La IDE debe estar preparada para responder a necesidades reales. Los usua- 
rios solo accederán a los datos alojados en servidores si con esta información 
va a ser posible la realización normal de su trabajo. Esto implica tanto que los 
datos sean correctos como que la forma de acceso sea sencilla, rápida y flexible. 

■ La IDE debe ser homogénea en su estructura a través de los distintos niveles 
tanto a nivel tecnológico como a nivel semántico. 

■ Debe existir un responsable claro de la gestión de la IDE que debe encargarse 
de asegurar que estén presentes los datos de referencia y que estos estén 
actualizados y sean fáciles de encontrar y de utilizar. Además, debe estar claro 
quién es el responsable de capturar y mantener cada elemento de información. 

■ La IDE debe estar respaldada por un presupuesto económico y de personal 
suficiente que cubra las necesidades que vayan surgiendo. 

Entre las razones principales a las que puede achacarse la implantación poco 
exitosa de algunas IDE, la mayoría pueden relacionarse con factores organizativos 
e institucionales. Otros factores, tales como los tecnológicos o los económicos, son 
causa igualmente de dificultades a la hora de establecer una IDE, aunque en menor 
medida. 

Algunas de las causas principales del fracaso de una IDE son las siguientes [402] : 

■ La falta de cultura informacional. 

■ Las relaciones de poder. 

■ La falta de visiones globales y de objetivos comunes. 

■ Las actitudes o posturas de rechazo de las personas hacia las nuevas tecno- 
logías. 

■ La falta de implicación o interés por parte de los usuarios en el desarrollo 
y/o posterior uso de la IDE. 

■ La falta de coordinación y liderazgo. 
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■ La infravaloración de los aspectos culturales y organizacionales. 

■ El desconocimiento del potencial de la información geográfica. 

30.6. Principales acuerdos e iniciativas 

La aparición del concepto de IDE ha traído consigo el desarrollo de numerosas 
iniciativas en los distintos niveles administrativos. Estas iniciativas han permitido 
que a día de hoy dispongamos de numerosas IDE operativas y funcionales, y son las 
que garantizan que cada una de ellas responda a los criterios establecidos y lo siga 
haciendo en el futuro. Cada Infraestructura de Datos Espaciales responde a una 
serie de elementos legislativos y políticos, y es por ello que por cada nodo de una IDE 
debe existir un marco correspondiente, bien sea este particularizado para el nodo 
en cuestión o bien heredando los contenidos del aplicable al nodo de orden superior. 

Aunque todavía queda por hacer hasta llegar a un verdadero estado de madurez 
de las IDE a nivel mundial, el desarrollo que estas han sufrido durante los últimos 
años es muy notable, y el número de IDE y de acuerdos que las sustentan es muy 
elevado. Lógicamente, no resulta de interés describir aquí todas estas iniciativas, 
máxime considerando que muchas de ellas tienen carácter local y no tienen apenas 
relevancia en el ámbito global de las IDE. No obstante, sí que es relevante conocer 
las iniciativas pioneras en este sentido, así como, especialmente, algunos de los 
acuerdos existente en los niveles superiores. Saber acerca de ellos es necesario para 
comprender el panorama actual de las IDE y estar familiarizado con las propuestas 
que rigen la gran mayoría de ellas. Veremos igualmente algunos ejemplos de acuer- 
dos existentes en cada uno de los distintos niveles, para comprender las diferencias 
entre ellos y la conexión que a su vez existe. 

En conjunto, estas iniciativas nos servirán para detectar patrones comunes a 
todas ellas, ayudándonos a entender las características básica de las IDE a través 
de algunos de sus representantes más importantes. 

30.6.1. GSDI 

La GSDI (Global Spatial Data Infrastructure) Association en una organización 
que agrupa a otras organizaciones, agencias, compañías e individuos de todo el 
mundo con objeto de apoyar las IDE y su desarrollo con carácter global. GSDI 
es responsable de aglutinar a todas ellas y coordinarlas, en un intento de trabajar 
en el nivel superior de la jerarquía de las IDE y poner en marcha una iniciativa 
que cubra la totalidad del territorio mundial. 

GSDI se fundó en 1996, y viene hasta la fecha realizando un trabajo fundamen- 
talmente basado en guiar el desarrollo de iniciativas locales y nacionales aún en 
sus inicios o que todavía no han llegado a comenzarse. En este sentido, GSDI actúa 
como un canalizado!' de toda la experiencia acumulada a lo largo de los últimos 
años por las distintas iniciativas IDE que han surgido, tratando de replicar en 
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las IDE que empiezan a desarrollarse el buen hacer de las más exitosas, así como 
evitar que se vuelvan a cometer los errores de las que no lo han sido tanto. 

En sus propias palabras, la misión de la GSDI se puede resumir en los siguientes 
puntos. 

■ Servir como punto de contacto para todos aquellos dentro de la comunidad 
global implicados en el desarrollo, implementación y avance de los conceptos 
de las IDE 

■ Impulsar las IDE que apoyan sistemas sociales, económicos y medioambien- 
tales sostenibles, integrados desde la escala local a la global. 

■ Promover el uso informado y responsable de la información geográfica y las 
tecnologías espaciales para el beneficio de la sociedad. 

30.6.2. NSDI 

Aunque hoy en día prácticamente todos los países tienen su propia IDE, la 
IDE de los Estados Unidos es especialmente importante entre todas ellas, ya 
que fue la primera en aparecer. Es decir, Estados Unidos fue el primer país en 
poner en marcha una iniciativa de gran calibre para apoyar a nivel nacional la 
creación y manejo coordinados de información geográfica, tal como los principios 
fundamentales de un IDE establecen. Por ello, resulta especialmente ilustrativa, 
tanto por el éxito del proyecto en estos años y la influencia directa que en la 
actividades de otros países ha tenido, como por el carácter de referente y la gran 
experiencia acumulada durante toda su existencia. 

La Infraestructura de Datos Espaciales de Estados Unidos, denominada NSDI 
(National Spatial Data Infrastructure), surge en abril de 1994 como consecuencia 
de la promulgación de la Orden Ejecutiva 12906 [16] , que insta a avanzar en la 
construcción de una infraestructura nacional de datos espaciales coordinada entre 
las administraciones federal, estatal y local, el sector privado y el académico. Esta 
Orden recoge las propuestas redactadas un año antes por el Comité Federal de 
Datos Geográficos (FGDC) [403], el cual queda a su vez como responsable del 
avance de la NSDI en el ámbito federal. 

No resulta extraño que la primera IDE apareciera en Estados Unidos, ya que el 
país contaba con una larga trayectoria de otras propuestas similares que trataban 
de promover un manejo racional y eficiente de la información geográfica, dirigiendo 
a los organismos federales en la dirección adecuada para lograr esto. Asimismo, 
existía una importante tradición en el uso de las tecnologías de la información 
espacial, que desde sus primeros momentos habían contado con abundante apoyo 
por parte de la administración. 

El gobierno federal llevaba desde los años 50 tratando de concienciar sobre 
la importancia de coordinar las labores relativas a la información geográfica. De 
especial importancia resulta la Circular A-16, redactada en 1953 y posteriormente 
revisada en 1973 y 1990. En esta última revisión se adaptan los contenidos a 
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la nueva realidad de la información geográfica, en un contexto sensiblemente 
modificado gracias a la aparición de los SIG y la cartografía digital, lo cual inicia 
el camino hacia la aparición de las IDE, y en particular de la NSDI estadounidense. 
Fue igualmente en ese año, 1990, cuando se creo el FGDC, en el cual se encuentran 
representadas las principales agencias federales con competencias en la producción 
de información espacial, y también, recientemente, otros organismos de de la 
administración estatal y local, así como del sector académico y privado. 

Seis son los objetivos principales que se plantean en la NSDI, a saber [404]: 

1 . La implantación de mecanismos para el descubrimiento, acceso y distribución 
de datos, materializados en una red electrónica distribuida que enlace a 
productores, gestores y usuarios de información geográfica. 

2. El establecimiento de estándares de intercambio de información. 

3. La documentación de los conjuntos de datos espaciales existentes y produci- 
dos en el futuro de acuerdo a un estándar de metadatos y su difusión pública 
a través de la red. 

4. La identificación y desarrollo de los conjuntos de datos espaciales más comu- 
nes y habitualmente necesitados (lo que se conoce como framework o datos 
marco ) . 

5. La difusión pública de la información espacial producida por la administra- 
ción federal. 

6. El establecimiento de acuerdos entre organismos para la producción de 
información espacial de interés conjunto, de forma que se eviten duplicidades 
y solapes de esfuerzos. 

Desde la creación de la NSDI, se ha avanzado notablemente en estos puntos, 
pudiendo decirse que se trata de una iniciativa exitosa que a lo largo de estos años 
ha logrado una buena parte de sus objetivos. El trabajo desarrollado ha tenido 
además una gran influencia en el ámbito de las IDE por su carácter pionero, lo 
que convierte a la NSDI en un referente de primera línea dentro de este campo. 

30.6.3. INSPIRE 

INSPIRE [405] es la principal directiva europea relativa a información geo- 
gráfica, y surge como continuación de algunos intentos previos que llevaban 
desarrollándose en Europa desde los años 90, todos ellos sin demasiado éxito. El 
problema de estas propuestas era que no partían de algún órgano de gobierno 
comunitario, sino directamente de los productores de cartografía. 

En septiembre de 2001, sin embargo, surge una iniciativa de la Dirección 
General de Medio Ambiente de la Unión Europea, encaminada también a mejorar 
el manejo de información geográfica en sus tareas y proyectos, gran parte de los 
cuales son de carácter transfronterizo. 

En conjunto con la Agencia Europea Eurostat, y el Instituto para el Medio 
Ambiente y la Sostenibihdad, a través de su Centro de Investigación Común (Joint 
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Research Center, JRC), ponen en marcha la iniciativa INSPIRE (Infraestructure 
for Spatial Information in Europe), cuyos objetivos principales son [406]: 

■ Poner a disposición de órganos responsables de toma de decisiones o apli- 
cación de políticas comunitarias (esencialmente de Medio Ambiente) datos 
espaciales abundantes y fiables. 

■ Establecer servicios integrados de Información Geográfica (IG), basados 
en una red distribuida de bases de datos, enlazadas por normas comunes y 
protocolos que aseguren la interoperabilidad. 

■ Optimizar los datos disponibles mediante la documentación de la información 
espacial. 

■ Lograr la coherencia de la información espacial entre diferentes niveles y 
temas. 

■ Crear servicios destinados a mejorar la accesibilidad e interoperabilidad de 
los datos y a la eliminación de obstáculos para su utilización. 

A finales de 2001, se constituye un grupo de expertos formado por represen- 
tantes de los Estados Miembro, de los países candidatos, así como representantes 
regionales y de los principales organismos directamente vinculados con la produc- 
ción y explotación de información tanto medioambiental como geográfica. 

Este grupo de expertos da forma a unos principios que han de regir el desarrollo 
de INSPIRE, y que son los siguientes[407]: 

■ Los datos deber recogerse y mantenerse en el nivel en el que esto resulte más 
efectivo. 

■ Debe ser posible combinar de modo continua información geográfico de 
distintas fuentes a lo largo de toda Europa y compartirla entre múltiples 
usuarios y ámbitos de aplicación. 

■ Debe ser posible que la información recogida en un nivel se comparta con 
otros niveles. 

■ La información geográfica necesaria para una correcta gestión debe ser 
abundante bajo condiciones que no impidan su uso extensivo. 

■ Debe ser fácil descubrir qué información geográfica está disponible, reúne 
las características para un uso determinado y bajo qué condiciones puede 
ser obtenida y usada. 

■ Los datos geográficos deben ser sencillos de entender e interpretar, así como 
de seleccionarse en un entorno de usuario amigable. 

Desde la redacción de estos principios, INSPIRE ha seguido su desarrollo hasta 
finalmente ser aprobada de modo formal por el Consejo Europeo (29 de enero 
de 2007) y el Parlamento Europeo (12 de febrero de 2007). Fue publicada como 
Directiva 2007/2/CE el 14 de marzo de 2007. 

La figura 30.4 muestra un esquema de la secuencia temporal que ha seguido 
INSPIRE, desde su nacimiento hasta la actualidad. 

INSPIRE contiene 3 anexos en los que se especifica qué datos deben formar 
parte de la IDE, ya sea con carácter obligatorio o con carácter opcional. De este 
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Construcción de consenso en los grupos de expertos 
Orientación y documentos de posición de los expertos 
Establecer el estado del arte 

Preparación de la propuesta => Directiva Marco 
Determinación del alcance y medidas 
Evaluación del impacto político y socio-económico 
Revisión pública de las medidas propuestas 

Aprobación de la Directiva Marco de la Comisión 

La propuesta de la agenda política de la Presidencia de la UE 

Procedimiento de codecisión por el Consejo y el Parlamento 

Aprobación de la Directiva 

Transposición de la Directiva 2007/2/CE 

Intercambio de datos y puesta en marcha de las IDE 


2001 


2002 


2003 


2004 


2004-07 


2007-09 


2009-16 


Figura 30.4: Secuencia temporal seguida por INSPIRE (adaptado de [17]) 


modo, se establece el contenido deseado para los datos creados y almacenados por 
los distintos nodos de la IDE, con objeto de obtener un conjunto global de datos 
coherente y facilitar la realización de la mayor parte de tareas en todos los lugares, 
así como a todos los niveles de detalle. Es decir, que exista una coherencia tanto 
horizontal como vertical en lo que a datos existentes respecta. 

Las tablas en 30.1 muestran los tipos de datos que se recogen en los citados 
anexos. 

30.6.4. Las IDE en España 

Además de las iniciativas anteriores, existen en el mundo muchas otras de 
menor escala o más recientes, muchas de las cuales todavía no están plenamente 
establecidas, y cuyo éxito no puede aún garantizarse dada su corta vida. 

En lo que a España respecta, contamos con la Infraestructura de Datos Espacia- 
les Española (IDEE) [408] , que se encarga de coordinar a las distintas organizaciones 
del ámbito nacional implicadas en la producción y distribución de cartografía. 
La IDEE arrancó en 2002 cuando la Comisión Permanente del Consejo Superior 
Geográfico aprobó el 10 abril la puesta en marcha de una Infraestructura Nacional 
de Datos Espaciales. En noviembre de ese mismo año se estableció un Grupo de 
Trabajo IDEE con todos los actores implicados. El grupo se organizó a su vez 
cuatro Subgrupos de Trabajo: Datos de Referencia, Metadatos, Arquitectura y 
Normas, y Política de Datos, Precios y Licencias. En la actualidad el número de 
estos subgrupos es de 1 1 . 

Previamente a la reunión de este Grupo de Trabajo, existían proyectos ante- 
riores cuya labor y experiencia se integra en la IDEE en la medida de lo posible. 
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Anexo I: Datos de referencia 

Sistema de ref. de coordenadas 
Cuadrículas geográficas 
Nombres geográficos 
Unidades administrativas 
Redes de transporte 
Hidrografía 
Lugares protegidos 


Anexo II: Datos de referencia 


Modelos de Elevaciones 
Direcciones y áreas postales 
Parcelas catastrales 
Ocupación del suelo 
Ortofotos 


Anexo III: Datos temáticos 


Unidades estadísticas 
Edafología 
Uso del suelo 
Instalaciones de servicios 
Instalaciones Agrícolas y Acuicultura 
Regiones biogeográficas 
Áreas restringidas o reguladas 
Condiciones Atmosféricas 
Características oceanógraficas 


Edificaciones 

Geología 

Salud y seguridad humana 
Instalaciones industriales y productivas 
Hábitats y biotopos 

Demografía y distribución de la población 
Zonas de riesgos naturales 
Características meteorológicas 
Regiones Marinas 


Cuadro 30.1: Datos especificados por los anexos I, II y III de INSPIRE, estableciendo 
los datos de referencia y temáticos a incluir en una IDE. 


Uno de los más destacados es DIGA, un proyecto propio de metadatos coordinado 
por el Instituto Geográfico Nacional, en funcionamiento desde 1997. 

Cuatro son las acciones propuestas para establecer la IDEE [409]: 

1. Creación de un Portal Nacional de la IDE Española, que sirva de punto de 
entrada genérico para España y cumpla la función de paraguas que acoja 
todos los recursos disponibles que la configuran. 

2. Establecimiento de un Nodo Español de Datos de Referencia (Topográficos), 
que acoja en la IDE todos aquellos datos que pueden ser considerados de refe- 
rencia en el sentido definido por INSPIRE. Otros nodos españoles temáticos 
o sectoriales (Datos Ambientales, Geológicos, Inventario Forestal...) estarán 
accesibles en horizontal desde el mencionado Portal Nacional y convivirán 
al mismo nivel con el Nodo Español de Datos de Referencia (Topográficos). 

3. Implementación de un Catálogo que permita consultar de modo transparente 
e interoperable los metadatos que describen los distintos conjuntos de datos 
de referencia almacenados y documentados en sus respectivos centros de 
producción (IGN, ICC, ICA, DG del Catastro, etc.). 

4. Implementación de un conjunto de servicios que permita al usuario final 
solicitar servicios de geoprocesamiento, sencillos en un primer momento, que 
pueden evolucionar a otros más complejos. 
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5. Armonización gradual y progresiva de los recursos y componentes integrados 
en la IDE. 

Estando situada dentro del ámbito cubierto por INSPIRE, la IDEE debe 
cumplir lo establecido por esta directiva, manteniendo siempre sus características 
dentro de las recomendaciones, aunque pudiendo añadir sus propios elementos. 

Por debajo de la IDEE existen numerosas IDE regionales, las cuales proveen 
una buena parte de la información sobre la que se sustenta esta primera. Puede 
decirse que las IDE regionales gozan de buena salud, existiendo algunas de ellas 
desde el mismo momento en que la IDEE hizo su aparición. Uno de los proyectos 
pioneros a nivel regional en España es la IDE de Cataluña. En [410] puede encon- 
trarse un interesante estudio sobre IDE regionales, su viabilidad y éxito, basado 
en las IDE de Cataluña y de la región de Lombardía. 

La importancia de las IDE regionales no debe subestimarse, ya que sin ellas 
el funcionamiento de la IDE a otros niveles resultaría prácticamente imposible. 

Iniciativa Ámbito 


GSDI 
INSPIRE 
IDEE 
IDE Navarra 
IDE Pamplona 



Mundial 


Europeo 

Nacional 


Regional 

Local 


Figura 30.5: Ejemplo de estructura a distintos niveles para una IDE particular (IDE 
de Pamplona) (adaptado de [404]) 

Como cierre de este apartado, en la figura 30.5 puede verse un ejemplo de 
iniciativas a distintos niveles y la jerarquía existente entre ellas. Obsérvese cómo 
se relacionan algunas de las iniciativas presentadas en los apartados anteriores, 
y la dependencia existente. 

30.7. Resumen 

La situación actual en lo referente a la información geográfica hace necesario 
promover una correcta coordinación entre todos los organismos productores de 
datos espaciales, desde el nivel local al nivel estatal, con objeto de facilitar la 



explotación de esa información y evitar esfuerzos redundantes. Con este objetivo, 
surgen a partir de la mitad de la década de los 90 las Infraestructuras de Datos 
Espaciales, las cuales se componen de un conjunto de datos espaciales, tecnología, 
normas y planes institucionales. 

Existen diferentes niveles en una IDE, así como diferentes actores implicados, 
haciendo que una IDE sea mucho más que un conjunto de datos espaciales. Algunos 
de los elementos principales de una IDE son los metadatos, los estándares (veremos 
más sobre estos dos elementos en próximos capítulos) y los catálogos. Estos últimos 
permiten el descubrimiento de información geográfica y son el punto de entrada 
a los contenidos de las IDE. Las IDE se organizan mediante un conjunto de nodos, 
los cuales están a su vez interconectados y coordinados. 

Estados Unidos fue pionera en el establecimiento de una IDE, aunque actual- 
mente existen iniciativas en la mayoría de países. En la Unión Europea, la directiva 
INSPIRE dicta las pautas para el establecimiento de IDE en los países miembro, 
que han de crear sus propias IDE siguiendo los preceptos establecidos en ella. 
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Capítulo 31 


Metadatos 


Blake, Landon; Olaya, Víctor 

Los metadatos son aquellos datos que describen los datos espaciales y los servicios 
disponibles en una IDE. Los metadatos son uno de los puntos de entrada a la información 
geográfica contenida en una IDE ya que permiten a un actor sin ningún conocimiento 
de esta consultar qué puede ofrecer. En este capítulo describiremos en detalle qué son los 
metadatos, su utilidad, y cómo crearlos y emplearlos. 


31.1. Introducción 

Los datos contienen la información geográfica, y es esta la que empleamos en 
un SIG para realizar las distintas operaciones que ya hemos visto en anteriores 
capítulos de este libro. No obstante, esos datos pueden resultar insuficientes, ya 
que el proceso de interpretación mediante el que extraemos la información a partir 
de estos puede requerir conocer alguna otra serie de elementos. 

Por ejemplo, si tenemos las coordenadas de un punto disponemos de un dato, 
pero para interpretarlo correctamente necesitamos conocer, entre otras cosas, el 
sistema de coordenadas en que vienen expresadas esas coordenadas. El dato con el 
que trabajamos (las coordenadas), requiere unos datos adicionales (por ejemplo, el 
código EPSG del sistema de referencia empleado) para cobrar verdadero sentido. 

Surge así el concepto de metadatos. Literalmente, los metadatos son «datos acer- 
ca de los datos» y su misión es explicar el significado de los datos. Es decir, ayudan 
a los usuarios de los datos a entender mejor el significado que estos tienen y la in- 
formación que guardan. Los metadatos son un documento adicional que acompaña 
a los datos, y que permite una mejor gestión y una utilización más precisa de ellos. 

Trabajando en el entorno de un SIG, los datos con los que trabajamos son de 
tipo espacial, y como ya estudiamos en su momento (véase el apartado 4.3), existe 
una componente espacial y una temática. Los metadatos pueden referirse a ambas 
componentes, ya que es necesario documentar todas ellas, y podemos encontrar 
metadatos referidos a una capa de forma global, a su componente espacial o a su 
componente temática. 

Un ejemplo de metadato global de una capa puede ser el nombre de su autor o la 
fecha en la que ese dato ha sido creado. El sistema de referencia en el que se expresan 
las coordenadas de cada entidad recogida es un tipo de metadato relativo a la compo- 
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nente espacial. Y en lo referente a la componente temática, los metadatos pueden re- 
coger las unidades en las que se recoge una variable asociada a cada entidad, o bien al- 
macenar cualquier otro valor que permita una mejor interpretación de esa variable. 

En una definición más formal, los metadatos son archivos de información que 
recogen las características básicas de algún dato o recurso. Representan el quién, 
qué, cuándo, dónde, cómo y por qué de ese recurso. Los metadatos geoespaciales 
se emplean para documentar recursos geográficos digitales tales como una base de 
datos espacial, un SIG o una imagen de satélite. Un registro de metadatos incluye 
elementos básicos tales como el título o nombre del recurso, elementos geográficos 
como la extensión que cubre el dato o el sistema de coordenadas empleado, así 
como elementos relativos a la base de datos asociada tales como la definición de 
cada uno de sus campos o el dominio en que se encuentran los valores de estos [411] . 

El concepto de metadato no es algo nuevo y exclusivo de los datos digitales, ya 
que un mapa impreso también contiene metadatos en cierta forma. Una leyenda 
o un texto en un margen del mapa con información sobre la fecha en que se ha 
creado son también metadatos. En el caso de los datos geográficos digitales, los 
metadatos no forman parte del dato directamente sino que son independientes de 
este. Ello permitirá realizar operaciones separadamente con los metadatos, tales 
como búsquedas, que abren nuevas posibilidades y dan un gran valor a estos. 


31.2. La utilidad de los metadatos 

Dependiendo del tipo de dato con el que trabajemos y las operaciones que 
deseemos realizar con ellos, los metadatos correspondientes serán más o menos 
necesarios, pudiendo ser prácticamente irrelevantes o bien completamente im- 
prescindibles. Por ejemplo, si se trabaja con una única capa y gran parte de la 
información que esta contiene no va a emplearse para la realización de operaciones, 
los metadatos son menos necesarios que si se da un uso más intenso a los datos. 

En algunos casos, incluso si carecemos de metadatos, resulta posible interpretar 
correctamente los datos, como sucede si trabajamos con un MDE y valores de 
elevación en metros. Es fácil saber que los valores de elevación se encuentran en 
esas unidades aplicando cierta lógica, y procesarlos correspondientemente aunque 
no exista un dato explícito que así nos los indique. 

En otras circunstancias, los metadatos son necesarios, pues contienen informa- 
ción que no puede inferirse directamente desde los propios datos. Si varias capas 
están en sistemas de coordenadas distintos y deseamos aplicar las transformaciones 
correspondientes para unificarlos en uno único y procesarlas de manera conjunta, 
estas transformaciones no se pueden llevar a cabo si no conocemos el sistema de 
origen del que partimos en cada capa. En este supuesto, el trabajo con los datos 
viene condicionado a que existan los metadatos correspondientes. 

Los metadatos son, por tanto, sumamente importantes en el trabajo con SIG 
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y, como veremos en breve, cobran una importancia mayor todavía cuando no 
nos encontramos en el contexto de un uso aislado de los datos, sino cuando nos 
situamos en un entorno de un gran volumen de datos y numerosos usuarios. 

Dos de las funciones principales de los metadatos son garantizar el uso correcto 
y adecuado de los datos y facilitar su gestión, localización y consulta. 


31.2.1. Garantizar el uso correcto de los datos 

Uno de los beneficios más importantes que proporcionan los metadatos es 
asegurar que los datos espaciales son empleados de forma adecuada. Los datos espa- 
ciales, como muchos otros datos, son creados habitualmente para un determinado 
objetivo, y este objetivo no ha de ser necesariamente evidente o contenerse como 
tal en los datos mismos. Cuando se emplean esos datos para un objetivo distinto 
a aquel para el que fueron diseñados, pueden surgir problemas debido a que se 
está realizando un proceso para el que los datos con los que se trabaja presentan 
carencias. A continuación veremos algunos ejemplos para ilustrar algunas situa- 
ciones en las que puede producirse un uso indebido de los datos, las cuales podrían 
corregirse o evitarse mediante el empleo de los correspondientes metadatos. 

1. Un organismo crea un juego de datos con los ejes de las principales vías de 
una ciudad. Estos datos se emplean para labores de mantenimiento, de tal 
modo que faciliten la localización de las señales viales en la realización de 
inventarios. El juego de datos no contiene información sobre direcciones ni 
tampoco almacena la topología de la red. Posteriormente, una compañía 
especializada en reparto adquiere estos datos para el cálculo de rutas óptimas 
desde sus almacenes hasta las direcciones de destino de sus clientes. 

2. Un organismo crea un juego de datos con los elementos de la red de alcan- 
tarillado tales como alcantarillas, tuberías, bombas, etc. Durante años, esta 
capa no se actualiza. Años después de la creación de esos datos, ese mismo 
organismo desarrolla un proyecto relativo a la calidad de las aguas y el control 
de la contaminación y utiliza ese juego de datos. 

3. Una compañía mantiene un registro de los limites aproximados de las parcelas 
catastrales de una zona. El juego de datos, no obstante, no muestra las posibles 
discrepancias que pueden existir en esos límites, tales como solapes o huecos. 
Una inmobiliaria emplea ese juego de datos para asesorar a sus clientes y mos- 
trarles la localización y límites de las parcelas a los compradores potenciales. 

En los tres casos, nos encontramos con un usuario de un juego de datos que, 
por desconocer las características de este, realiza un uso indebido. 

En el primer caso, la compañía de reparto no podrá operar con esos datos, ya 
que no contienen la información que necesitan. Conocer de antemano las limita- 
ciones de los datos antes de adquirirlos o plantear cualquier operación con ellos 
ahorra tiempo y dinero. 
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En el segundo caso, la información contenida en el juego de datos está desfasada. 
Si los metadatos contienen la fecha en la que los datos fueron creados, esta puede 
emplearse para juzgar la validez de estos últimos en función de su antigüedad. 

Por último, en el tercer caso la compañía inmobiliaria trabaja con unos datos 
que no tienen la precisión requerida. Si existieran metadatos y estos dejaran 
claro que los límites de parcelas son aproximados, se conocería con exactitud las 
limitaciones de los datos y no se les daría un uso indebido. 

Estos tres ejemplos ponen de manifiesto la necesidad que existe de conocer 
acerca de los datos más que lo que ellos mismos contienen, en particular todo lo 
relativo a los fines para los que estos se han creado. Esto permite conocer lo que 
se puede esperar de los datos y no emplearlos en situaciones indebidas. 

Los creadores de datos deben procurar acompañar estos de metadatos precisos 
y suficientes, y los usuarios deben consultar estos antes de utilizar dichos datos. 
De este modo, se puede garantizar que un dato no es empleado de forma errónea 
y que los resultados que se obtendrán tendrán validez. 

Vimos en el capítulo 7 cómo la calidad se define como el conjunto de propiedades 
y de características de un producto o servicio que le confieren su aptitud para 
satisfacer unas necesidades explícitas e implícitas. Los metadatos documentan 
esas características y las de todas aquellas necesidades a las que pueden responder 
los datos, y de este modo documentan la propia calidad del dato. Como ya se 
dijo entonces, los metadatos son un elemento muy importante en relación con la 
calidad de los datos espaciales 

31.2.2. Facilitar la gestión los datos 

Las funciones anteriores ponen de manifiesto la utilidad e importancia de los 
metadatos en un contexto reducido en el que un individuo o un pequeño grupo 
trabaja con ciertos datos. La importancia de los metadatos se hace patente incluso 
cuando se dispone de un único dato (una sola capa) , pues es en el momento de 
utilizar este cuando se consultan los metadatos y se emplea la información que 
contienen para poder conocer la precisión de los datos, su referencia espacial, u 
otros elementos que permitan que ese uso sea más correcto. 

En esta situación, se dispone ya de los datos y de los metadatos, y estos últimos 
nos permiten conocer más acerca de los primeros. No obstante, en el panorama 
tecnológico actual un usuario no dispone de todos los datos que necesita, sino 
que puede acceder a ellos en la medida en que le sea necesario, del mismo modo 
que no guardamos en nuestro ordenador enciclopedias y libros, pero podemos 
acceder a ellos a través de Internet. Las tecnologías que vimos en el capítulo 23 
dedicado a servidores y clientes nos permiten acceder a una enorme cantidad de 
datos espaciales, y los metadatos juegan un papel clave en la gestión de estos. 

En el contexto de las Infraestructuras de Datos Espaciales es donde los metada- 
tos cobran una importancia mayor si cabe, ya que informan de las características 
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de los datos a los restantes actores de la IDE. Los metadatos constituyen un 
«resumen» de las características principales de los datos, y pueden ser empleados 
para labores de búsqueda y localización de datos de un tipo dado. De este modo, 
compartir los datos es más sencillo, y la difusión de estos se realiza de una forma 
más fluida. Es decir, la IDE alcanza mejor sus objetivos cuando los datos que 
contiene se encuentran correctamente documentados mediante buenos metadatos. 
Los catálogos que veíamos como parte integrante de la IDE necesitan los meta- 
datos para funcionar, ya que responden a las peticiones del usuario del catálogo 
en función de la información que los metadatos contienen. 

En el escenario actual, esta funcionalidad de los datos es preponderante sobre 
las restantes, y es por ello que tratamos los metadatos dentro de este libro en esta 
parte dedicada al factor organizativo, ya que son ante todo un elemento básico 
para la organización de los datos dentro del sistema SIG. 

Algunas características de los datos solo se contienen en los metadatos, como 
por ejemplo el sistema de coordenadas empleado o la descripción detallada de 
los distintos campos de la componente temática. Otros, por el contrario, pueden 
obtenerse a partir de los propios datos, como por ejemplo el área que cubre una 
capa. Aunque este tipo de valores sea posible obtenerlos procesando los datos en 
sí, añadirlos a los metadatos abre nuevas posibilidades en el marco de la gestión, 
permitiendo un manejo más dinámico. 

En general, los metadatos son mucho menos voluminosos que los datos a los 
que acompañan. Si en una IDE buscamos datos para una zona dada, es mucho más 
sencillo consultar los metadatos que consultar los datos como tales. Mientras que 
la primera operación puede realizarse de forma rápida, la segunda demanda unos 
cálculos mucho mayores, que con los grandes volúmenes que son habituales en una 
IDE puede hacer esa búsqueda virtualmente irrealizable. Es decir, que los metadatos 
facilitan y agilizan la localización de los datos cuando estos se buscan por criterios 
geográficos. Añadiendo a los metadatos elementos como la extensión del área cu- 
bierta por los datos, este tipo de búsquedas se efectúan de forma más ágil y efectiva. 

Cuando la búsqueda se realiza por otros criterios distintos, los metadatos son 
el elemento clave para poder realizar esta búsqueda. Si queremos localizar la capa 
más actual con un tipo de información dada, necesitamos conocer qué información 
contiene cada capa y cuándo se ha creado, para aplicar sobre esos datos los criterios 
de búsqueda correspondientes. Sin los metadatos, estas operaciones no son posibles. 

En su conjunto, los metadatos sirven para catalogar los datos y por tanto son 
básicos dentro de las IDE para hacer más fluida la transferencia de datos en ella. 

Facilitando la localización de datos adecuados para una determinada tarea se 
obtienen además beneficios colaterales. Haciendo más sencillo el acceso a los datos 
se pueden evitar esfuerzos redundantes tales como la creación o modificación de 
datos cuando existen dentro de la IDE otros que pueden servir para responder 
a una necesidad concreta. El uso de metadatos permite así ahorro de tiempo y 
dinero y un mejor aprovechamiento de los datos. 
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31.3. Características de los metadatos 

Los metadatos pueden ser tan variados en sus características como los propios 
datos a los que acompañan. Los enfoques para la creación de metadatos son muy 
diversos y ello da lugar a metadatos muy diferentes. 

Algunas de las características que resulta de interés tratar son las siguientes: 

■ Contenido de los metadatos. ¿Qué información contienen? 

■ Granularidad de los metadatos. ¿A qué elementos particulares hace referencia 
esa información? 

■ Forma de almacenamiento de los metadatos. ¿Cómo se guardan? 

31.3.1. Contenido de los metadatos 

Los valores que pueden incorporarse a los metadatos son muy abundantes, 
tantos como tipos distintos de información se considere necesario registrar respecto 
a un dato geográfico particular. 

Las características de los metadatos asociados a los datos dependerán direc- 
tamente de estos y de algunos factores como los siguientes: 

■ El tipo de dato y, en particular, el modelo de representación emplea- 
do. Los datos vectoriales tendrán asociados unos metadatos distintos que 
los correspondientes a datos ráster. 

■ El formato en que se almacenan los datos. El tipo de fichero o base 
de datos condiciona la información que puede almacenarse (vimos esto en 
detalle en la sección 6.9), y por tanto condiciona los metadatos. 

■ La organización, entidad o individuo responsable de la creación de 
los datos y el uso que se pretende dar a estos. Puesto que, como hemos dicho, 
los datos se crean para un objetivo definido, este objetivo y los intereses de 
quien ha creado los datos definirán el tipo y cantidad de información que se 
recoja en los metadatos. Datos pensados para un catálogo público tendrán 
asociados metadatos distintos que datos privados con acceso restringido, del 
mismo modo que datos pensados para un uso muy concreto presentarán unos 
metadatos diferentes a los que acompañarán a unos datos de uso más genérico. 

■ El elemento al que se asocian los metadatos. Como veremos en el 
siguiente apartado, podemos asociar metadatos a un juego de capas, una 
capa o una entidad aislada dentro de una capa. Esto implica diferencias en 
el contenido de los metadatos, pues esos elementos tienen características de 
distinta naturaleza. 

■ El estándar empleado para crear los metadatos. En el capítulo 32 veremos 
los estándares que existen para los metadatos geográficos y la forma que 
estos tienen, la cual define directamente su contenido. 

Algunos de los elementos comunes que se incorporan a los metadatos geográficos 
son los siguientes: 
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■ Información de identificación. Este tipo de información permite identi- 
ficar de forma única un dato geográfico y distinguirlo de otros. Esta informa- 
ción ayuda a catalogar los datos, e incluye el nombre, palabras claves, una 
descripción básica o la ya mencionada extensión geográfica de los datos. 

■ Información sobre la calidad de los datos. La información sobre la 
calidad de los datos puede incluir, entre otros elementos, aquellos relativos 
a la completitud de estos, los procesos que se han empleado en su creación 
y mantenimiento, o las operaciones de validación y verificación a las que se 
han sometido. 

En relación con los procesos empleados, es importante reseñar que muchos 
de los algoritmos de algoritmos que ya conocemos toman algún tipo de dato 
geográfico como entrada y generan algún otro nuevo. Es decir, toman una 
o varias capas y generan nuevas capas como resultado. Para documentar 
la calidad de los datos resultantes se debe documentar en los metadatos la 
procedencia completa de estos, indicando las metodologías empleadas para 
su creación y todos los metadatos propios de las capas de entrada. 

Un ejemplo de esto puede ser el proceso de cálculo de una capa de pendientes 
a partir de un MDE. Este MDE tendrá a su vez unos metadatos asociados 
(entre ellos algunos relativos a su calidad) , y la bondad y calidad de la capa de 
pendientes está ligada directamente a la del MDE. Por tanto, en los metadatos 
debe hacerse referencia a ese MDE o bien a las características de este. 

Si el MDE no se ha adquirido directamente, sino que se ha elaborado haciendo 
uso de otros procesos tales como interpolación a partir de curvas de nivel, se 
ha de añadir también a los metadatos la información correspondiente a esos 
procesos, especificando por ejemplo el método de interpolación usado, los pa- 
rámetros de ajuste de este o incluso el software mediante el que se ha aplicado. 
Con esto, puede «rastrearse» el origen de los datos y se dispone de una base 
sobre la que evaluar la calidad de estos en función de dicho origen. Tenemos 
así el concepto de linaje de los datos. Esta idea es similar a la de trazabilidad 
empleada en otros sectores como, por ejemplo, el alimentario. 

■ Información sobre la representación del dato espacial. Se incluyen 
en este grupo la precisión y exactitud de los datos, la escala de trabajo o la 
resolución en el caso de capas ráster. Este tipo de metadatos están también 
íntimamente ligados con la calidad de los datos. 

■ Información sobre la componente no espacial. Información relaciona- 
da con los atributos que acompañan a las capas vectoriales, o bien relativas a 
las variables que se recogen en capas ráster. Esto incluye explicaciones sobre el 
significado de los nombres de cada uno de los atributos, el rango de valores vá- 
lidos para cada uno de ellos o los métodos empleados para recoger estos datos. 

■ Información sobre la distribución. Esta información sirve para definir 
el acceso a los datos y las posibilidades de distribución de estos, especificando 
quiénes pueden acceder a ellos y quiénes no, o en qué condiciones pueden 
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hacerlo. También puede recoger elementos como la fecha en que fueron 
publicados los datos o bien cuándo fueron puestos a disposición del público, 
de tal forma que se disponga de toda la información referente a su presencia 
en el marco de una IDE o una red. 

De entre estos, algunos son considerados como fundamentales y se incluyen 
de forma genérica, mientras que otros pueden o no incorporarse. Al definir una 
especificación de metadatos, se pueden establecer niveles de prioridad, establecién- 
dose un grupo de propiedades básicas que han de documentarse siempre y otro 
con propiedades de carácter opcional. 


31.3.2. Granularidad de los metadatos 

Habitualmente, los metadatos están asociados a un conjunto de datos al com- 
pleto. Este conjunto de datos que sirve como unidad a la hora de crear metadatos 
coincide en general con la idea de capa en un SIG. Es decir, cada capa tiene asociado 
un bloque de metadatos. 

Esto no quiere decir, no obstante, que no puedan registrarse metadatos a un 
nivel distinto. Dependiendo del tipo de datos con los que se trabaje, puede resultar 
de interés o incluso necesario asociar metadatos a unidades distintas. 

Algunos metadatos como el sistema de coordenadas serán compartidos por 
todos los elementos de una capa, y por tanto es lógico en su caso emplear la capa 
como unidad básica en lo que a metadatos se refiere. Otro metadatos, sin embargo, 
hacen referencia a elementos particulares dentro de la capa. 

Este tipo de metadatos aparecen especialmente cuando a lo largo del ciclo de 
vida de los datos se introducen modificaciones en estos, editándolos o añadiendo 
nuevas entidades. Si bien en el origen el creador de los datos es una única entidad, 
otras entidades pueden alterar esos datos y deberán actualizar correspondiente- 
mente los metadatos. Registrando como autores de los datos a ambas entidades 
se recoge más información al respecto, pero esta puede no ser suficiente. Sabemos 
que los datos fueron creados por una entidad A y posteriormente modificados 
por una entidad B, pero si tomamos un elemento dado no podemos saber si esta 
corresponde al trabajo original de A o a la modificación realizada por B. 

De modo similar, podemos incorporar a los metadatos las dos fechas de creación 
y edición de los datos, así como parámetros relativos a la calidad de los datos o 
las metodologías empleadas para recogerlos en ambos instantes. Sin embargo, no 
podemos saber en qué fecha fue incorporado un elemento concreto o la calidad 
de los datos que definen ese elemento en particular. 

En estas circunstancias, resulta más conveniente optar por metadatos más 
granulares, de forma que puedan recogerse particularizados para las distintas 
entidades de la capa. 

Por ejemplo, algunos de los datos que pueden resultar de interés a escala de 
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elemento (en el caso de una capa vectorial, hablamos de una geometría y sus 
atributos asociados) son los siguientes: 

■ Quién ha creado ese elemento. 

■ Quién ha modificado ese elemento. 

■ Cuándo fue creado originalmente. 

■ Cuándo ha sido modificado por ultima vez. 

■ Cuántas veces ha sido modificado. 

■ Una descripción del objeto real que este elemento representa. 

Podemos encontrar el caso opuesto, en el que varias capas comparten los 
mismos metadatos, y por tanto estos pueden asociarse a escala de toda una familia 
de datos. Ese es el caso cuando se tiene un conjunto de capas generadas por una 
misma entidad y para un mismo fin, las cuales cubren una amplia zona geográfica 
y debido a ello se encuentran divididas horizontalmente. Estas circunstancias se 
dan de forma habitual en series de datos de carácter nacional o autonómico, y 
conforman una de las situaciones en las que el registro de metadatos puede hacerse 
para toda la serie en su conjunto, al menos para algunos de esos metadatos. 


Metadatos asociados 
a un juego de datos 



Metadatos asociados 
a una capa 


Figura 31.1: Granularidad de los metadatos. Los metadatos pueden hacer referencia 
a elementos a distinta escala. 


Los metadatos pueden así registrarse a una escala distinta a la de la capa como 
unidad de datos, aunque esta sigue siendo la referencia más habitual a la hora de 
crear metadatos (Figura 31.1). 
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31.3.3. Forma de almacenamiento de los metadatos 

Si para los propios datos geográficos encontramos muy diversas alternativas 
a la hora de almacenarlos, la situación no es distinta a la hora de almacenar los 
metadatos. Las dos alternativas principales son el uso de ficheros independientes 
o el almacenamiento en bases de datos [412] . 

Elegir entre uno u otro enfoque depende del conjunto de datos de trabajo, su 
volumen total, el uso principal que se le da o la granularidad de los datos según 
vimos en el apartado anterior. [411] recomienda el uso de bases de datos cuando los 
datos estén sujetos a frecuentes modificaciones o si existe una parte de los metadatos 
que es común a varios grupos de datos. Este es el caso que vimos en el apartado 
anterior al mencionar los metadatos correspondiente a toda una serie de datos. 

Utilizando una base de datos, resulta más sencillo actualizar los datos, espe- 
cialmente si puede haber varios usuarios que realicen esas actualizaciones. Como 
veremos más adelante, existen servicios relacionados con la información geográfica 
que van a permitir a varios usuarios modificar un mismo juego de datos base. Las 
modificaciones que estos usuarios hagan han de reflejarse en los metadatos, y para 
ello es necesario contar con una tecnología que permita un acceso concurrente 
similar para los metadatos. Las bases de datos proveen esas capacidades, y son 
por tanto adecuadas para el almacenamiento de metadatos en ese contexto. 

Si, por el contrario, los datos no van a ser usados de esa forma, no es probable 
que deban modificarse con frecuencia y apenas contienen elementos comunes, una 
forma más simple de almacenarlos es utilizando ficheros independientes, general- 
mente ficheros de texto plano que son más sencillos de producir y además pueden 
leerse con un simple editor de texto. 


31.4. Creación de metadatos 

La creación de los metadatos no es tarea de un único grupo de profesionales 
ni se lleva a cabo en un único momento dentro del ciclo de vida de los datos. Por 
el contrario, distintas entidades o grupos pueden crear o editar los metadatos, y 
pueden hacerlo a lo largo de todo el tiempo de existencia de dichos datos. 

Los metadatos puede crearse en el mismo origen de los datos, recogiendo 
la información al mismo tiempo que se producen los datos en sí. Esta creación 
puede derivar de la digitalización de mapas impresos o de la medición directa de 
valores, entre otros procesos. Las organizaciones que se encargan de crear datos 
son responsables en este caso de crear los metadatos que los acompañan. 

Las entidades responsable de distribuir datos geográficos y ponerlos a dispo- 
sición de los distintos usuarios pueden igualmente crear metadatos en caso de 
que estos no existan. Estas entidades no producen datos, pero recogen datos de 
sus creadores y han de prepararlos para ofrecer un mejor servicio. Los metadatos 
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aportan un valor añadido a los datos y facilitan la gestión de datos que estas 
organizaciones han de realizar. 

Por último, los mismos usuarios y beneficiarios de los datos pueden crear 
metadatos o ampliar los ya existentes. Si estos usuarios modifican los datos, 
esas modificaciones deben recogerse en los metadatos. Aún así, incluso si no se 
producen modificaciones, puede resultar de interés añadir nueva información en 
los metadatos, particularmente aquella que estos no contengan pero que pueda 
tener valor para los objetivos que se persiguen usando esos datos. Igualmente, 
dejar de usar los datos por alguna razón tal como el hecho de que se encuentren 
desactualizados es una información que los mismos usuarios pueden incorporar a 
los metadatos, informando así a futuros usuarios de la falta de validez de esos datos. 

En resumen, los metadatos pueden ser creados o modificados en los siguientes 
puntos dentro de la vida de los datos: 

■ Cuando se crean los datos. 

■ Cuando se organizan o catalogan los datos. 

■ Cuando se modifican o editan los datos. 

■ Cuando se archivan o descatalogan los datos. 

En circunstancias ideales, todo dato debería tener asociados unos metadatos, 
y estos últimos deberían crearse siempre que se creen dichos datos y actualizarse 
siempre que estos se modifiquen. La realidad, sin embargo, es que una gran parte 
de los datos geográficos que existen no tiene metadatos asociados, o bien estos no 
son lo suficientemente detallados. 

Una razón importante para ello es la falta de concienciación que existen por 
parte tanto de creadores de datos como de usuarios respecto a la importancia 
de los metadatos. Mientras que para un usuario aislado o un pequeño grupo de 
técnicos SIG puede no resultar importante generar metadatos a la hora de crear 
algún dato geográfico, cuando nos encontramos con organizaciones más grandes 
e infraestructuras de datos mayores los metadatos se hacen imprescindibles. El 
usuario aislado prefiere generalmente no dedicar tiempo (la creación de metada- 
tos no es en absoluto sencilla y es una tarea que consume tiempo) a crear unos 
metadatos que no percibe como importantes para su trabajo con los datos. 

Si en lugar de datos geográficos habláramos de libros, una persona normal no 
cataloga los libros que tiene en su casa y recopila información acerca de cada uno de 
ellos, almacenándola en una base de datos. En una gran biblioteca, sin embargo, esta 
labor es imprescindible, pues de otro modo resulta imposible gestionar tanto el gran 
fondo bibliográfico del que se dispone como el amplio número de lectores y usuarios. 

En realidad, incluso en el nivel más local, las ventajas de la creación de metada- 
tos son grandes, especialmente si consideramos que un dato creado y utilizado en 
un entorno local puede más adelante pasar a formar parte de una infraestructura 
de datos de mayor envergadura. 

La creación de metadatos no tiene que ser necesariamente una labor propia 
del técnico o equipo de técnicos que crean los datos en sí, del mismo modo que 
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el escritor de un libro no es el encargado de catalogar este. Tanto usuarios como 
creadores de datos geográficos deben poseer unos conocimientos básicos en relación 
a los metadatos, pero existen expertos en metadatos a quien la creación de estos 
debe corresponder en última instancia. 

Los usuarios deben saber consultar e interpretar los metadatos, y ser conscientes 
de la importancia de estos y el papel que juegan en una buena parte de las opera- 
ciones que pueden desarrollarse con los datos. Los creadores, por su parte, deben 
ser capaces de elaborar no los metadatos en sí directamente, pero sí la información 
necesaria acerca de los datos que debe incluirse en los metadatos, y transmitirla 
de forma correcta a los profesionales encargados de crear esos metadatos. 

31.4.1. Herramientas para crear metadatos 

Existe un amplio conjunto de herramientas que facilitan la labor de creación 
de metadatos. Entre ellas podemos distinguir las siguientes [412], 

■ Editores de texto. Los metadatos pueden almacenarse en un fichero de 
texto plano, y por tanto pueden editarse con cualquier programa que permita 
la creación y edición de tales ficheros. Lo habitual en este caso es disponer de 
un fichero plantilla que contenga los distintos campos que se han de registrar 
para cada conjunto de datos geográficos, y la creación del metadato consiste 
simplemente en apoyarse en esa plantilla y a continuación de cada nombre 
de campo añadir el valor correspondiente. 

■ Formularios. A partir de una definición de campos como la anterior, se 
pueden desarrollar herramientas más elaboradas que presenten una interfaz 
gráfica con distintas cajas de texto o listas desplegables. Estas aplicaciones, 
además de ser más agradables para el usuario, permiten incorporar elementos 
de validación en el proceso, evitando que en algún campo se introduzcan 
valores incorrectos o avisando al usuario en caso de que un campo presente 
un valor sospechoso. 

Del mismo modo, se puede establecer qué campos son obligatorios y cuáles 
opcionales, y avisar en caso de que un metadato no contenga valores para 
todos sus campos obligatorios. 

■ Utilidades. Existen aplicaciones que no se emplean directamente para 
introducir los valores de los metadatos, pero que pueden intervenir en el 
proceso. Entre ellas están aquellas que chequean y validan los metadatos 
o las que lo preprocesan dándole un formato adecuado según unas reglas 
establecidas de antemano. 

■ Herramientas de creación automática de metadatos. Algunos de los 
valores que se incorporan a los metadatos pueden extraerse de los propios 
datos. Por ello, el proceso de creación de metadatos puede automatizarse en 
cierta medida, y existen aplicaciones específicamente diseñada para realizar 
esa tarea. 
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Las aplicaciones de creación automática de metadatos pueden, por ejemplo, 
analizar un archivo con una capa vectorial y crear un archivo adjunto de 
metadatos en el que se incluya la extensión de la capa, el tipo de geometrías 
que tiene o los campos de su tabla de atributos, indicando además el tipo 
de valor en cada uno de ellos. 

Además de estos metadatos extraídos directamente del dato geográfico, las 
herramientas que automatizan este proceso pueden añadir información co- 
mún introducida manualmente en una única ocasión, y que se repite de forma 
automática en todos los datos creados. Así, por ejemplo, si una de estas 
herramientas automáticas se emplea en un organismo, puede establecer como 
creador de cada nuevo dato a esa entidad, sin necesidad de que la persona 
encargada de crear dicho dato deba añadir esa información manualmente 
cada vez que genere algo nuevo. 

El uso de herramientas automáticas no se limita al momento de creación de 
los datos, sino que también pueden emplearse durante la actualización de 
estos. Si se actualiza un dato empleando un SIG, este puede estar conectado 
con la aplicación de creación automática de metadatos y lanzar esta para 
que vuelva a analizar ese dato y actualizar los metadatos inmediatamente. 
Quizás sea necesario añadir información manualmente, pero una buena parte 
de esta habrá sido creada de forma automática, facilitando el proceso y 
haciéndolo más rápido. 

La importancia de este tipo de aplicaciones es grande si se tiene en cuenta que, 
como se ha dicho, una de las razones principales de la carencia de metadatos 
es la cantidad de tiempo que se requiere para elaborarlos. 


31.5. Algunos ejemplos 

La mejor forma de entender el contenido de los metadatos es ver algunos 
sencillos ejemplos reales. Puesto que estos datos son generalmente voluminosos 
(siempre que tengan el detalle necesario para ser realmente útiles), en lugar de 
reproducirlos aquí, puedes consultarlos en las direcciones Web [413] y [414], cada 
una de las cuales tiene un ejemplo concreto. 

En ellas pueden verse verse los metadatos con un formato de página Web sencilla 
compuesta de una lista de apartados y campos, así como su valores correspondientes. 
A la hora de utilizar la información que estos metadatos contienen desde una apli- 
cación tal como un servidor Web, es necesario no obstante recogerlos en un formato 
que dicha aplicación pueda entender y procesar utilizando un esquema dado y una 
semántica bien definida. Es decir, que el software que trabaja con metadatos no lo 
hace a través de documentos como los de esas páginas Web, cuyo formato tiene como 
único fin mostrarlos de forma legible para una persona. En el capítulo 32 veremos 


algunos estándares relacionados con metadatos que definen formas estandarizadas 
de recoger estos para facilitar el trabajo de las aplicaciones los utilizan. 

Si se comparan los campos y apartados que aparecen en ambas páginas, puede 
verse que no coinciden completamente. Eso es debido a que esos metadatos han sido 
generados por distintos organismos, que no utilizan una única metodología. En el 
mencionado capítulo 32 veremos también que esas formas estandarizadas no solo 
lo son en lo referente al formato, sino también a los contenidos, con objeto de homo- 
geneizar los metadatos generados por organizaciones distintas, proporcionándoles 
unos criterios comunes a seguir. 

31.6. Resumen 

Para que los datos sean verdaderamente útiles es necesario acompañarlos de 
otros datos adicionales que los describan y aporten información suplementaria acer- 
ca de ellos. Estos datos adicionales son los metadatos, y recogen información tanto 
de la componente espacial como de la componente temática del dato geográfico. 

La importancia de los metadatos se hace patente en la gestión de la calidad 
de los datos, o a la hora de utilizarlos como base para procesos, pues es necesario 
conocer todos los detalles relativos a los datos con los que se trabaja. Sin embargo, 
es dentro de las IDE donde los metadatos abren gran número de nuevas posibi- 
lidades y se demuestran como una pieza imprescindible, ya que permiten que las 
operaciones de descubrimiento y consulta de los datos se efectúen de forma eficaz. 

Los metadatos pueden asociarse con los datos geográficos en niveles de detalle 
diversos, desde una única entidad hasta una colección de varias capas. Esto permite 
trabajar con ellos en distintas granularidades. El contenido de los metadatos es tam- 
bién variable, y depende de esa granularidad, así como de otros parámetros, como 
por ejemplo el tipo de datos, ya que la información adicional que puede recogerse 
sobre una capa vectorial no es la misma que la correspondiente a una capa ráster. 

Algunas de las secciones más importantes que encontramos en los metadatos 
son la identificación del dato, los valores relativos a su calidad o los relacionados 
con su distribución, entre otros. 


Capítulo 32 
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Olaya, Víctor; Turton, lan 

Dentro de una IDE, debe ser posible acceder a los datos desde distintos puntos y hacerlo 
de forma simple y eficaz. Para maximizar el valor de la IDE y hacerla más útil para todos 
sus actores, es imprescindible que el acceso a los datos geográficos no presente problemas. 
Para ello, es importante definir de forma adecuada cómo se establece la comunicación 
entre clientes y servidores, de forma que estos primeros no solo puedan obtener los propios 
datos geográficos de estos últimos, sino también realizar consultas o conocer qué otras 
funcionalidades se encuentran disponibles. 

En otras palabras, resulta necesario definir una lingua franca para que todas las comu- 
nicaciones se produzcan de forma fluida. Esto obliga a establecer una cierta normalización y 
crear elementos estandarizados que sean conocidos e implementados por los distintos actores 
de la IDE, y hacerlo para cada uno de los servicios ofrecidos, asi como para los propios datos. 

En este capítulo veremos con detalle la importancia de los estándares y el papel exacto 
que juegan en una IDE, y describiremos una buena parte de los que actualmente existen. 

Puesto que estos estándares están relacionados con las tecnologías cliente-servidor y las 
IDE, los capítulos correspondientes a estos elementos ( capítulos 23 y 30 respectivamente ) 
son un requisito necesario para comprender mejor el contenido de este capítulo. 


32.1. Introducción 

En el capítulo 23 vimos los elementos tecnológicos que permiten ofrecer a 
través de una red de servicios relacionados con la información geográfica. Estos 
servicios eran muy diversos, y ofrecían posibilidades que iban desde obtener un 
dato en sí hasta la realización de consultas sobre el conjunto de operaciones que 
un servicio dado puede ofrecer. En todos ellos aparecen un cliente y un servidor, 
los cuales se comunican para realizar una tarea concreta. 

Este modelo de cliente-servidor en términos tecnológicos no es muy diferente 
de la idea de un cliente y un proveedor de servicios en la vida real. Una persona 
(el cliente) que quiera adquirir un producto de un distribuidor (el servidor) debe 
igualmente comunicarse con él para preguntarle si dispone del producto deseado, 
realizar una petición de este y después recibirlo cuando el distribuidor se lo envíe. 
En una IDE, un usuario puede consultar el catálogo para localizar un dato concreto 
y después acceder a él remotamente mediante, por ejemplo, un cliente Web. Ambos 
esquemas de funcionamiento son muy semejantes. 
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Imaginemos ahora la situación en la que una persona en España desea adquirir 
un producto electrónico de un proveedor chino. En primer lugar, es probable que 
tenga dificultades para entender el catálogo de productos, pues este describirá cada 
uno de ellos en chino. Si consigue localizarlo y desea adquirirlo, es igualmente pro- 
bable que encuentre dificultades para comunicárselo al proveedor, ya que seguirá 
existiendo la misma barrera lingüística. Y si finalmente recibe el producto, puede 
tener dificultades al utilizarlo, ya que este puede funcionar a un voltaje distinto al 
de la red eléctrica española o bien estar preparado para un tipo de enchufe distinto. 

Este pequeño ejemplo nos hace ver que en la relación cliente-servidor pueden 
surgir problemas derivados de la falta de elementos comunes entre ambos actores. Si 
todos los elementos que toman parte en el establecimiento de esa relación comercial 
estuvieran normalizados y fueran únicos, un comprador de cualquier parte del 
mundo podría de forma inmediata comprar un dispositivo a cualquier vendedor 
de otro país comunicándose en un único idioma, y tener después la garantía de 
poder usarlo sin problemas. 

En el ámbito de la información geográfica la situación es similar a la anterior. 
Hay muchos formatos distintos para almacenarla y muchas formas distintas de 
transmitirla, y ello dificulta el trabajo en el marco de una IDE. Igual que los 
clientes españoles no hablan el mismo idioma que los vendedores chinos, no todos 
los clientes SIG hablan el mismo idioma que todos los servidores, y dos cualesquiera 
de ellos no han de «entenderse» necesariamente. 

De hecho, históricamente los distintos fabricantes de clientes definían por sí 
mismos la forma en que sus programas se comunicaban, que no coincidía con la 
del resto de fabricantes. Un cliente de un fabricante dado no podría acceder a 
los servicios de un servidor creado por un fabricante distinto. Este paradigma, 
característico del software privativo, es un problema en el marco de una IDE, pues 
dificulta el acceso a los datos. 

En circunstancias ideales, en el marco de la IDE debe existir una total in- 
teroperabilidad con independencia de los formatos y las aplicaciones empleadas, 
pudiendo interactuar entre sí los distintos clientes y servidores. Los estándares son 
el elemento que va a permitir esa interoperabilidad, definiendo el marco común 
que clientes y servidores emplearán para entenderse. En un contexto altamente 
heterogéneo tanto en datos como en herramientas, lograr esto no resulta una 
tarea sencilla [4 15], y los estándares son los encargados de aportar homogeneidad 
tecnológica y favorecer todo el trabajo a desarrollar dentro de una IDE. 


32.2. Estándares abiertos e interoperabilidad 

La interoperabilidad implica que podemos sustituir unos elementos del sistema 
en el que se incluyen los clientes y servidores por otros distintos, teniendo la 
seguridad de que van a interaccionar entre ellos sin dificultades. Las funcionali- 
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dades que un cliente o servidor nos ofrece pueden ser distintas a las de otro, pero 
independientemente de su origen (independientemente del fabricante), si esos 
elementos implementan un estándar dado, siempre podrán interactuar con todos 
aquellos que también lo implementen. 

La clave, por tanto, está en los estándares, y en particular en que estos sean 
estándares abiertos. Un estándar es un documento o práctica que busca armonizar 
los aspectos técnicos de un producto o servicio. 

Un estándar se considera como tal cuando es empleado por un grupo o comu- 
nidad, que lo acepta para la definición de las características de ese producto o 
servicio en su seno. Si únicamente es el uso del estándar el que lo ratifica como tal, 
se denomina estándar de facto. El formato shapefile para capas vectoriales, por 
ejemplo, es uno de estos estándares, ya que está ampliamente difundido y existe tal 
cantidad de datos en este formato que todas las aplicaciones deben implementarlo 
para tener valor práctico. 

Existen estándares que se convierten en normas o estándares de iure, cuando 
estos son promovidos por algún organismo oficial de normalización o su uso se 
impone con carácter legal. 

Un estándar abierto es aquel cuya definición se encuentra disponible y todo 
aquel que lo desee puede conocerla y emplearla para el desarrollo de la actividad 
relacionada con ese estándar. En nuestro campo de trabajo, eso quiere decir que 
cualquier desarrollador que desee crear un nuevo cliente o servidor para datos SIG 
puede acceder al estándar y desarrollar en base a este. 

Los principios fundamentales de los estándares abiertos son los siguientes [416] : 

■ Disponibilidad. Los estándares abiertos están disponibles para todos el 
mundo para su lectura y uso en cualquier implementación. 

■ Máxima posibilidad de elección para los usuarios finales. Los están- 
dares abiertos crean un mercado competitivo y justo, y no bloquean a los usua- 
rios en el entorno de un vendedor particular. Desde el punto de quienes venden 
la tecnología SIG, esto no es tan ventajoso, ya que permite la aparición de com- 
petidores que antes no podían existir. Si un fabricante basa sus productos en 
un estándar cerrado definido por él mismo, otros no pueden elaborar solucio- 
nes que trabajen con esos productos, ya que no conocen el estándar empleado. 
Asimismo, el fabricante puede cambiar el estándar utilizado por, por ejemplo, 
su producto de servidor, y obligar a los consumidores y a todo aquel que 
quiera utilizar un servicio basado en ese servidor a que actualicen también los 
clientes, pues los anteriores ya no podrán comunicarse con el nuevo servidor. 
Utilizando estándares abiertos, la competencia entre fabricantes ha de ba- 
sarse puramente en las capacidades que ofrecen, con lo que los consumidores 
ganan en calidad de los productos y en posibilidades de elección. 

■ Gratuidad. Implementar un estándar es gratuito, sin necesidad de pagar, 
como en el caso de una patente. Los organismos que generan los estándares 
pueden cobrar una cierta cantidad por acceder a la definición de los están- 
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dares, con objeto de financiar así la labor que desarrollan, y también pueden 
cobrar por emitir certificados de que un determinado producto o servicio 
se ha desarrollado de acuerdo con el estándar. 

■ Discriminación. Los estándares abiertos y las organizaciones que los desa- 
rrollan no favorecen de ningún modo a uno u otro implementador sobre los 
restantes. 

■ Extensión o creación de subconjuntos de un estándar. Los estánda- 
res abiertos pueden ser extendidos o bien presentados como subconjuntos 
del estándar original. 

■ Prácticas predatorias. Los estándares abiertos pueden tener licencias que 
requieran a todo aquel que desarrolle una extensión de dicho estándar la 
publicación de información acerca de esa extensión, y el establecimiento 
de una licencia dada para todos aquellos que creen, distribuyan y vendan 
software compatible con ella. Un estándar abierto no puede prohibir de otro 
modo el desarrollo de extensiones. 

Para tener una noción de lo que en la práctica realmente significa el uso de 
estándares abiertos en el campo de los SIG y las IDE, podemos ver la figura 32.1, 
donde se representa el esquema de una arquitectura no interoperable. Es decir, 
una arquitectura que no se basa en este tipo de estándares. 



Figura 32.1: Esquema de una arquitectura no interoperable. 

Los datos que se encuentran en cada base de datos son accesibles únicamente a 
través de un único cliente, que es aquel correspondiente al servidor que ofrece servi- 
cios basados en esos datos. Los restantes datos quedan fuera del alcance de ese clien- 
te, ya que no es capaz de acceder a ellos. Las diferentes soluciones cliente-servidor 
crean en esta situación un conjunto de islas tecnológicas, cada una completamente 
independiente y sin posibilidad alguna de interactuar con las restantes. 

Entre los principales inconvenientes de una arquitectura no interoperable como 
la representada podemos citar los siguientes: 

■ Desperdicio de recursos. Cada servicio debe gestionar sus propio con- 
junto de datos, lo cual requiere abundantes recursos y no es sencillo, además 
de implicar un elevado coste. 
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■ Necesidad de conocer múltiples clientes. Si para acceder a cada ser- 
vicio necesitamos su cliente particular, acceder al conjunto de servicios 
ofrecidos por esos servidores requiere por parte de los usuarios aprender a 
utilizar tantos clientes como servidores existan. 

■ Imposibilidad de combinar datos. Dos datos a los que pueda accederse 
a través de dos servidores distintos no podrán utilizarse simultáneamente 
en un único cliente, ya que este no podrá comunicarse con ambos servidores. 
Un análisis que requiera distintos tipos de datos no podrá realizarse si todos 
ellos no se ofrecen a través de un mismo servidor. 

■ Imposibilidad de combinar funcionalidades. Los datos ofrecidos por 
un servidor pueden usarse para el desarrollo de muchas tareas. Estas tareas 
requieren que las correspondientes herramientas estén disponibles en los 
clientes, y estos se diferencian notablemente, de la misma forma que lo hacen 
también los SIG de escritorio entre sí. Si acceder a los datos a través de 
un servidor solo se puede hacer empleando un cliente concreto, no existe 
la posibilidad de aprovechar las funcionalidades de otro cliente sobre esos 
mismos datos, y el usuario ve así limitadas sus posibilidades de trabajo. 

En contraste con lo anterior, tenemos una situación de plena interoperabilidad 
basada en estándares abiertos como la representada en el esquema de la figura 32.2. 



Figura 32.2: Esquema de una arquitectura interoperable. 

En este caso, existe un servidor que es el que gestiona y ofrece los servicios 
para cada base de datos, pero a él pueden acceder todos los clientes, ya que por el 
hecho de estar basados en estándares abiertos es posible una comunicación plena 
entre dos cualesquiera de ellos. 

En esta situación, un usuario puede emplear su cliente favorito (siempre que este 
implemente los estándares pertinentes) para acceder a muchos servicios distintos, 
o bien puede utilizar varios clientes para acceder a unos mismos datos, eligiendo 
en cada momento el que más le convenga según sus necesidades. Las posibilidades 
de trabajo se multiplican cuando la arquitectura del sistema se fundamenta en 
estándares abiertos. 

Las ventajas no son solo para los usuarios, sino también para los desarrolladores. 
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A la hora de crear un cliente, no es necesario comprobar que este se comunica bien 
con todos los servidores y funciona correctamente, sino simplemente seguir las espe- 
cificaciones del estándar. Todo aquel servidor que las implemente funcionará sin difi- 
cultades, ya que el estándar garantiza la buena comunicación y la interoperabilidad. 


32.3. Entidades creadoras de estándares 

Crear un estándar no es una labor sencilla. Se han de recoger las principales 
necesidades y armonizar todas ellas en una especificación única, de modo que 
clientes y servidores que implementen ese estándar sean de la mayor utilidad 
posible para todos los usuarios. 

Existen organizaciones dedicadas a redactar las especificaciones correspon- 
dientes a estándares que cubran los distintos servicios, así como a promoverlas y 
mejorarlas. Los estándares más habituales en el campo de la información geográfica 
son elaborados por tres organizaciones: el Open Geospatial Consortium (OGC), 
ISO y W3C. 

32.3.1. Open Geospatial Consortium (OGC) 

El Open Geospatial Consortium [417] es una organización internacional y 
voluntaria dedicada a la elaboración de estándares. En el OGC participan más de 
350 organizaciones miembro, incluyendo entre ellas a los principales fabricantes del 
sector, agencias nacionales, grupos de investigación u organizaciones sin ánimo de 
lucro, entre otros. Estas organizaciones miembro colaboran para alcanzar consensos 
y desarrollar e implementar estándares en el ámbito de los contenidos geoespaciales. 

Algunos de los estándares OGC más relevantes, los cuales veremos a lo largo 
de este capítulo, son los siguientes: 

■ WMS. Para obtener imágenes de mapas. 

■ WCS. Para obtener y consultar coberturas. 

■ WFS. Para obtener y editar entidades geográficas y sus atributos asociados. 

■ WPS. Para servicios de procesos remotos. 

■ GML. Para almacenamiento de información geográfica. 

■ CSW. Para consultas en catálogos. 

Cada uno de estos estándares está descrito en una especificación, y estas están 
sujetas a cambios y mejoras, existiendo varias versiones en cada caso. 

32.3.2. ISO 

ISO [418] es una organización internacional dedicada a la elaboración de están- 
dares no solo en el ámbito geográfico, sino en todas las áreas. ISO es responsable, 
por ejemplo, de estándares bien conocidos y aplicados en la industria actual, tales 
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como los relacionados con la gestión medioambiental en empresas o los estándares 
de calidad. 

Dentro de ISO existen diversos comités técnicos, cada uno de los cuales se 
encarga de definir los estándares correspondientes a un campo de trabajo. El 
comité ISO/TC 211 es el responsable de aquellos relacionados con la información 
geográfica digital. 

ISO redacta Especificaciones Técnicas y Estándares Internacionales, catalo- 
gando estos con un número que los identifica. Los elaborados por ISO/TC 211 
corresponde a la serie 19100. 

Existe una estrecha relación entre ISO y OGC, y los estándares elaborados por 
ambas organizaciones son muchos de ellos muy similares o incluso idénticos. De 
hecho, algunos de los estándares desarrollados por el OGC, como WMS o GML, 
citados anteriormente y que en breve detallaremos, son también estándares ISO. 

En [419] puede consultarse la lista de normas ISO/TC211 aprobadas y el estado 
de cada uno de sus documentos de trabajo. 

32.3.3. W3C 

El Consorcio World Wide Web (W3C) es un consorcio internacional donde las or- 
ganizaciones miembro, personal a tiempo completo y el público en general, trabajan 
conjuntamente para desarrollar estándares Web. Según su propia definición [420] , la 
misión del W3C es «guiar la Web hacia su máximo potencial a través del desarrollo 
de protocolos y pautas que aseguren el crecimiento futuro de la Web». 

El W3C no guarda una relación directa con los SIG, pero parece lógico pensar 
que todo aquello que se haga en el seno de Internet debería acomodarse a las 
pautas establecidas por este consorcio, en especial si lo que se desea es maximizar 
la interoperabilidad, como ya hemos visto que resulta de interés en el ámbito SIG. 
Puesto que la mayoría de los estándares abiertos que vamos a ver en este capítulo 
se aplican sobre tecnologías que operan en la red, estos se han de fundamentar 
siempre que sea posible en otros existentes desarrollados por el W3C, o al menos 
seguir las recomendaciones de este organismo. 

Visto de otro modo, el W3C persigue objetivos similares a los de las organi- 
zaciones que elaboran estándares para la información geoespacial, pero su campo 
de actuación es la red en términos generales. 

De entre todos los elementos definidos por el W3C, resulta de especial impor- 
tancia el lenguaje XML (eXtensible Markup Language 1 ). XML no es un lenguaje 
en sí, sino que permite definir la gramática de otros lenguajes. Es lo que se conoce 
como metalenguaje. De este modo, puede utilizarse para definir reglas para crear 
formas de expresión que permitan recoger cualquier tipo de información. Esto hace 
que pueda emplearse para el intercambio de información de toda clase, y como 
veremos es la base de la mayoría de estándares a tratar en este capítulo. 


1 Lenguaje de Marcado Extensible 
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Entrar en detalles acerca de XML escapa del ámbito de este libro. No obstante, 
para aquellos que deseen saber más, Internet está llena de buenas referencias libres 
sobre XML, como por ejemplo [421]. 


32.4. Estándares para representación y obtención de 
información geográfica 

Entre los estándares más importantes encontramos aquellos que especifican la 
forma de recoger la información geográfica, así como aquellos que definen el modo 
en que esta se transmite. 

Los siguientes estándares OGC forman parte de este grupo. 

32.4.1. Simple Features for SQL (SFS) 

Sabemos del capítulo 11 que el lenguaje SQL en su forma básica no sirve 
para recoger las geometrías que forman la parte espacial de una entidad, sino 
únicamente los datos no espaciales de esta. Sin embargo, versiones posteriores de 
SQL permiten la definición de tipos personalizados, y esto puede emplearse para 
poder incorporar estos elementos espaciales dentro del lenguaje. 

El problema surge debido a que la propia flexibilidad de este mecanismo 
permite que los tipos se implementen de diversas formas, lo cual no favorece la 
interoperabilidad. Si una consulta se establece sobre unos tipos definidos de forma 
distinta a como lo están en la base de datos que recibe la consulta, esa consulta no 
podrán procesarse correctamente. Es necesario definir una forma estandarizada 
de definir esos tipos, y una pauta a seguir para su implementación. 

OGC define la especificación Simple Features for SQL (SFS) [422] con objeto 
de hacer frente al problema anterior. SFS define por un lado unos tipos estandari- 
zados para geometrías, los cuales se basan en otra especificación OGC denominada 
OpenGIS Geometry Model , que establece una forma de definir geometrías. Por 
otra parte, se definen una serie de operaciones SQL que operan sobre esos tipos. 

Todas las geometrías que pueden definirse según este esquema son geometrías 
en un espacio bidimensional, y cada objeto geométrico está asociado a un sistema 
de referencia en el cual se define. 

Existe un objeto fundamental denominado Geometry del que heredan los 
restantes en una jerarquía bien definida (Figura 32.3). Los métodos de este objeto 
son de tres tipos: 

■ Métodos básicos. Proveen información sobre el objeto (dimensión, tipo de 
geometría, sistema de referencia, etc.) 

■ Métodos para comprobar relaciones espaciales entre objetos geométricos 
(cruza a, contiene a, se intersecta con, etc.) 
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■ Métodos que efectúan algún tipo de análisis (unión de geometrías, distancia 
entre geometrías, area de influencia de una geometría, etc.) 



Figura 32.3: Esquema de clases de geometrías en Simple Features for SQL. 

Cada uno de los objetos derivados de la clase raíz Geometry tiene además a su vez 
sus propios métodos específicos, siempre dentro de alguno de los grupos anteriores. 

Con estos objetos y sus métodos se da respuesta a todas las necesidades que apa- 
recen en la realización de consultas sobre bases de datos espaciales. La especificación 
SFS permite así dotar de potencia al lenguaje de consulta SQL y hacerlo de forma 
estandarizada para ampliar la interoperabilidad en las operaciones de consulta. 

32.4.2. Geography Markup Language (GML) 

El Geography Markup Language (GML) [423] es un lenguaje basado en XML, di- 
señado para el almacenamiento de información geográfica. Utilizando este lenguaje, 
resulta posible el intercambio de información geográfica de forma interoperable. 

GML puede utilizarse para transmitir información a través de una red, como 
parte de un servicio. Este es el caso del servicio WFS que veremos más adelante, que 
devuelve información geográfica codificada según este lenguaje. No obstante, puede 
emplearse igualmente para almacenar la información con la que trabajamos de un 
SIG, del mismo modo que utilizamos cualquiera de los formatos de archivo que vimos 
en el capítulo 6. Es decir, sin que tengan que mediar servicios en ningún momento. 


790 


Sistemas de Información Geográfica 


Algunos SIG permiten este uso, y soportan GML como un formato más de 
archivo. No obstante, no es una práctica común, ya que, pese a las ventajas de ser 
un estándar aceptado, GML es un formato de fichero de tipo texto (está basado en 
XML) y produce archivos de gran tamaño. Para este uso, es más habitual recurrir 
a algún otro formato. 

GML es un lenguaje extremadamente genérico, que permite recoger tanto datos 
ráster como vectoriales y hacerlo con mucha flexibilidad. Permite, por ejemplo, 
recoger datos vectoriales sin que exista una geometría asociada, es decir, sim- 
plemente almacenando unos atributos como si se tratara de una base de datos 
no espacial. Esta gran flexibilidad, que es uno de los puntos fuertes de GML, es 
también uno de sus inconvenientes, ya que la especificación es muy compleja y 
difícil de implementar en su totalidad. 

La versión más reciente de GML es GML3, aunque GML2 es la más extendida. 

Existe un dialecto conocido como Simple Features Protocol que trata de so- 
lucionar el problema de la excesiva complejidad de GML3, ofreciendo las ventajas 
más importantes de este frente a GML2, pero sin incorporar todos sus elementos. 


32.4.3. Web Feature Service (WFS) 

El servicio Web Feature Service WFS [424] está relacionado con los datos de tipo 
vectorial, y a través de él se sirven directamente las entidades de un dato vectorial 
con sus geometrías y datos alfanuméricos asociados. Desde este punto de vista, 
acceder a un servicio WFS es similar a acceder a una capa vectorial cualquiera o a 
una base de datos, ya que el SIG puede recuperar la información correspondiente 
(tanto la componente geográfica como la temática de cada entidad) y operar con ella. 

En particular, las operaciones que permite un servicio WFS son: 

■ Crear una nueva entidad. 

■ Borrar una entidad. 

■ Actualizar una entidad. 

■ Obtener o consultar el conjunto de entidades en base a condiciones espaciales 
y no espaciales. 

Para realizar lo anterior, un servicio WFS debe permitir las siguientes opera- 
ciones: 

■ GetCapabilities. Esta operación devuelve los metadatos correspondientes 
al propio servicio WFS. Estos contienen una descripción del contenido del 
servicio y los parámetros que este acepta a la hora de realizar peticiones 
sobre él. Es decir, la respuesta a esta operación es un documento que informa 
acerca del servicio y de los datos disponibles a través de este. Este documento 
es un archivo XML que debe comunicar al cliente el tipo de entidades que 
sirve y las operaciones que soporta sobre estas. 

■ DescribeFeature Type. La respuesta a esta operación es la descripción de la 
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estructura de las entidades que pueden servirse, indicando tipo de geometría 
y nombre y tipo de campos asociados a esta. 

■ GetFeature. Como respuesta a esta operación, el servidor devuelve un con- 
junto de entidades. El cliente puede especificar restricciones tanto espaciales 
como no espaciales en los parámetros de la operación, para así limitar el 
conjunto de entidades obtenidas. 

Estas entidades son devueltas por el servidor en formato GML. 

■ Transaction. El servidor puede realizar transacciones. Estas se componen 
de operaciones que modifican las entidades, tales como la creación de una 
nueva, o la actualización o eliminación de una ya existente 2 . 

En función de lo anterior, podemos distinguir dos tipos de servicios WFS: 

■ Un servicio WFS básico, que solo provee las tres primeras operaciones. Es 
decir, que permite consultar los datos, pero no modificarlos. 

■ Un servicio WFS transaccional (WFS-T) que implementa la operación de 
transacción y por tanto permite realizar modificaciones en las entidades. 

La versión más actual de la especificación WFS es la 1.1. No obstante, la 
versión 1.0 es la implementada mayoritariamente en los servidores actuales. WFS 
1.1 utiliza GML3 como lenguaje para la codificación de la información a servir, 
mientras que WFS 1.0 usa GML2. 

32.4.4. Filter Encoding 

Cuando un cliente efectúa una petición a un servidor WFS, no es necesario que 
obtenga de este todas las entidades de una capa. Incluso para una zona geográfica 
dada, el usuario puede querer obtener a través del cliente solo aquellas entidades 
que cumplan un criterio dado. 

Ya conocemos elementos que permiten realizar ese tipo de consultas para 
trabajar con un subgrupo de las entidades de una capa. En el capítulo 11 vimos 
el lenguaje SQL, mediante el cual podían definirse consultas de esta clase. 

El estándar Filter Encoding [425] define un formato basado en XML para el al- 
macenamiento de expresiones de filtrado según otro estándar OGC conocido como 
OGC Common Catalog Query Language. La expresión del filtro expresada según 
la especificación Filter Encoding puede ser validada y procesada por herramientas 
adicionales para convertirla en las expresiones correspondientes en otro lenguaje 
para consulta de bases de datos espaciales. Por ejemplo, en una clausula WHERE 
de SQL que emplear en una sentencia SELECT. 

Las expresiones que pueden recogerse empleando Feature Encoding pueden 
ser consultas con componente espacial o hacer referencia a la parte temática de 
la información geográfica. Es decir, que permiten recoger toda la variabilidad de 
las consultas espaciales que vimos en el capítulo 11 

2 Recuérdese el concepto de transacción visto en el capítulo 8 sobre bases de datos 
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Además de emplear estas expresiones para consultar servicios WFS, pueden 
utilizarse igualmente para otros como los servicios de Nomenclátor (Gazetteer) 
que veremos más adelante, y en general en todos aquellos en los que tenga sentido 
especificar algún tipo de restricción a la hora de realizar una petición al servidor. 

32.4.5. Web Coverage Service (WCS) 

Si el estándar WFS permite obtener de un servidor datos vectoriales en forma 
de entidades, el estándar Web Coverage Service hace lo propio con datos ráster. 
Este servicio está pensado para tratar con coberturas, es decir, representaciones de 
un fenómeno que varía en el espacio. Como ya vimos en su momento, las coberturas 
se corresponden con el modelos de campos. 

Representar una cobertura puede hacerse de muchas formas distintas: capas 
ráster, Redes de Triángulos Irregulares (TIN) o funciones matemáticas. No obs- 
tante, por el momento el estándar WCS solo está preparado para el trabajo con 
mallas ráster regulares. 

EL servicio WCS ofrece los datos de la capa ráster como tales, con su semántica 
original. Es decir, que un servicio WCS puede servir un MDE y el cliente obtiene 
directamente los valores de elevación en sus unidades correspondientes. 

De forma similar a WFS, WCS presenta tres operaciones básicas que permiten 
consultar al servicio por sus características o por las características de los datos 
de que dispone, y obtener finalmente los datos en sí. 

■ GetCapabilities. Describe las capacidades del servicio, indicando las cober- 
turas de que dispone. 

■ DescribeCoverage. Describe una cobertura particular 

■ GetCoverage. Obtiene una de las coberturas disponibles. Los parámetros de 
esta operación se emplean para indicar al servidor la extensión que se desea 
cubrir. 


32.5. Estándares para mapas y visualización 

De entre todos los estándares que vamos a ver en este capítulo, los más impor- 
tantes por ser los más extendidos son los que sirven mapas. Entendemos por mapa 
en este contexto a una representación gráfica de una determinada información 
geográfica, elaborada a partir de una o más capas. 

Gran parte de los sitios Web que ofrecen información geográfica lo hacen en 
forma de mapas, es decir, que permiten simplemente «ver» los datos geográficos, 
y los estándares de esta sección son los encargados de definir ese tipo de servicios. 

El estándar WMS, el principal en esta categoría, está ampliamente probado 
e implementado en gran cantidad de software, y es el soporte fundamental para 
cientos de aplicaciones basadas en mapas, lo que ratifica su utilidad y validez. 



Estándares 


793 


32.5.1. Web Map Service (WMS) 

El estándar Web Map Service (WMS) [426] define los elementos necesarios 
para un servicio de mapas. 

Un servicio WMS devuelve una imagen con información geográfica, pero esta 
solo contiene la propia información visual para que el cliente pueda mostrarla. Es 
decir, si se pide a este servicio un mapa creado a partir de un MDE, la información 
de los píxeles no contiene la elevación de la coordenada correspondiente, sino el 
color asociado en función de un determinado criterio. La imagen puede contener 
otros elementos visuales tales como etiquetas o símbolos, en función de cómo se 
haga la representación en el servidor. Una vez que el cliente recibe la imagen, no 
puede actuar sobre esta para cambiar la forma de representación de una capa, sino 
simplemente representarla como es. 

Se definen en este servicio tres operaciones básicas, dos de ellas obligatorias y la 
restante opcional, que son empleadas por los clientes para consultar los servidores. 

Las tres operaciones fundamentales son: 

■ GetCapabilities (obligatoria): Al igual que en el caso de WFS y WMS, esta 
operación describe el servicio, informando de los mapas disponibles. 

■ GetFeaturelnfo (opcional) : Esta operación permite al cliente pedir al servidor 
información particular sobre algunas entidades representadas en el mapa. Si 
el servidor soporta esta operación, los mapas que devuelve pueden consultar- 
se. Para ello, la consulta hecha por el cliente debe añadir ciertos parámetros 
adicionales como una localización (una coordenada dentro de la imagen) y 
el número de entidades cercanas de las que se desea obtener información. 

■ GetMap (obligatoria): Esta operación devuelve una imagen de un mapa 
con unos parámetros geoespaciales y dimensionales (tamaño de la imagen) 
definidos. El cliente utiliza esta función para obtener un conjunto rectangular 
de píxeles, los cuales conforman una imagen de un mapa correspondiente a una 
zona geográfica dada, o un conjunto de elementos gráficos dentro de esa zona. 
La operación GetMap permite asimismo al cliente especificar qué capas 
emplear para formar la imagen a obtener, el sistema de referencia a utilizar, 
el área geográfica a cubrir o el formato en el que se desea recibir la imagen 
(de entre una serie de formato habituales soportados). 

Las capas pueden especificarse como accesos a otros servicios tales como WFS. 

En un servicio WMS, cuando el cliente pide un mapa al servidor, puede con- 
trolar en cierto modo la forma en que este va a representarlo (colores, estilos, 
etc.). El servidor ofrece una serie de opciones predeterminadas, de las cuales el 
cliente solo conoce su nombre, y puede elegir una de ellas. No obstante, no puede 
saber exactamente qué caracteriza a cada uno de esos perfiles predeterminados 
de representación ni tampoco puede definir los suyos propios. 

Para solucionar esto y ampliar las capacidades del servicio WMS, aparece otro 
nuevo estándar: SLD. 
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32.5.2. Standard Layer Description (SLD) 

El estándar OGC Standard Layer Description (SLD) [427] define una forma 
de almacenar los parámetros de representación empleados para crear un mapa a 
partir de los datos geográficos. Este estándar permite extender las capacidades de 
WMS, ofreciendo al cliente la posibilidad de definir sus propias configuraciones. 

SLD es un estándar complejo que permite cubrir situaciones variadas y no solo 
las más sencillas y habituales. Permite, por ejemplo, el ajuste de elementos tales 
como etiquetas o simbologías personalizadas para elementos puntuales (por ejemplo, 
representar cada punto de una capa de localizaciones de estaciones de autobús con 
un pequeño dibujo de un autobús), Para esto último se apoya en otros estándares 
tales como SVG [428], diseñado para la representación de gráficos vectoriales. 

Las simbologías recogidas en un documento SLD pueden emplearse para la 
representación tanto de capas ráster como vectoriales. 

A la hora de definir una simbología para una capa, es necesario conocer cierta 
información acerca de esta. Para definir una simbología sencilla en la que todos los 
elementos de una capa van a ser representados de igual forma (por ejemplo, todos las 
líneas de una capa de ríos con un grosor dado y en color azul) , esta información no es 
imprescindible, pero en caso de que se quiera variar ese color o ese grosor en función 
de un atributo, será necesario conocer qué atributos tiene la capa y de qué tipo son. 

Para hacer esto, pueden emplearse las operaciones de los servicios de donde 
se toman los datos a representar. La operación DescribeLayers del servicio WFS 
permite conocer los tipos de entidades de una capa representada. La información 
sobre los atributos puede obtenerse con la operación DescribeFeatureTypes. 

32.5.3. Web Mapping Context (WMC) 

El estándar Web Mapping Context (WMC) [429] define un formato estanda- 
rizado para almacenar un contexto. Un contexto recoge la información necesaria 
para reproducir las condiciones de una determinada sesión de uso de un cliente, 
de tal forma que ese cliente pueda restablecerlas posteriormente. El contexto se 
almacena en un archivo XML. 

En el contexto se almacena información sobre las capas que forman el mapa 
representado por el cliente y los servidores de los que estas se obtienen, la región 
cubierta por el mapa, así como información adicional para anotar este mapa. 

Los usos que se le pueden dar a un contexto son variados, entre ellos los 
siguientes: 

■ Mediante un contexto se puede definir una configuración particular de inicio 
para distintos tipos de usuario del cliente. 

■ Un contexto puede emplearse para almacenar el estado del cliente a medi- 
da que el usuario navega y modifica elementos, pudiendo retornar a una 
configuración establecida anteriormente. 
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■ El contexto puede almacenarse y después transferirse a otro cliente distinto 
en el que comenzar en una misma configuración. 

Los contextos pueden a su vez catalogarse y descubrirse, ofreciendo así un 
nivel de granularidad más amplio que las capas individuales. Pueden crearse 
diferentes contextos predefinidos y después hacer estos accesibles para facilitar 
el establecimiento de una determinada configuración en un cliente. 


32.6. Estándares para metadatos, catálogos y consul- 
ta de datos 

Los metadatos y las operaciones sobre ellos tienen sus propios estándares bien 
definidos. 

Por una parte, existen estándares dedicados a los metadatos en sí y a la forma 
de almacenarlos. Estos pueden especificar parámetros relativos a los metadatos 
tales como los siguientes: 

■ Contenido de los metadatos, definiendo qué campos son obligatorios y cuáles 
opcionales. 

■ Formato de almacenamiento. En general, una descripción del formato a 
emplear. 

■ Prácticas adecuadas de creación y actualización. Se definen las pautas co- 
rrectas que han de seguirse a lo largo del ciclo de vida de los datos. 

■ Reglas de conformidad. Reglas que permiten comprobar si un determinado 
nretadato se encuentra conforme con el estándar. 

Por otro lado, un conjunto de metadatos conforma la base para las consultas 
sobre un catálogo, el cual describe a su vez un conjunto de datos. Como ya vimos, 
el catálogo constituye una forma más sencilla y eficaz de consultar los datos, agili- 
zando las operaciones y permitiendo el descubrimiento de datos de forma óptima, 
por lo que la consulta de estos metadatos también debe estar estandarizada, y 
debe definirse cómo los clientes deben obtener la información de los metadatos 
para posteriormente, a partir de dicha información, realizar el acceso a los datos 
correspondientes que resulten de interés. 

32.6.1. ISO 19115 e ISO 19119 

ISO 19115 e ISO 19119 son los estándares ISO para metadatos asociados a 
información geográfica. Definen más de 400 elementos, de los cuales los siguientes 
forman parte de su núcleo fundamental. 

■ Título 

■ Fecha de referencia de los datos 

■ Idioma 

■ Categoría en que encuadrar la temática de los datos 
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■ Resumen 

■ Punto de contacto para los metadatos 

■ Fecha de los metadatos 

■ Organismo responsable de los datos 

■ Localización 

■ Juego de caracteres de los datos 

■ Resolución espacial 

■ Formato de distribución 

■ Tipo de representación espacial 

■ Sistema de referencia 

■ Recurso en línea 

■ Identificador del fichero de metadatos 

■ Nombre del estándar de metadatos 

■ Versión del estándar de metadatos 

■ Idioma de los metadatos 

■ Juego de caracteres de los metadatos 

En España, existe el Núcleo Español de Metadatos (NEM), un subconjunto 
de la ISO 19115 definido por un subgrupo de trabajo de la IDEE. 


32.6.2. Nomenclátor (Gazetteer) 

Un nomenclátor o gazeteer permite la localización de fenómenos geográficos a 
partir de un determinado nombre. El catálogo sobre el que se basa es una colección 
de estos fenómenos, cada uno de ellos asociados a un identificador geográfico. 
Dicho identificador es una referencia espacial en forma de etiqueta o código que 
identifica un lugar en el mundo real [430]. Ejemplos de tales identificadores son los 
nombres de ciudades o pueblos (Burgos, Plasencia), los códigos postales (10600), 
los accidentes geográficos (Puerto de Navacerrada, Pico de la Miel) o las direcciones 
(Carretera N-V p.k.35, Calle Mayor 32), entre otros. Así, el servicio de nomenclátor 
permite establecer un sistema de referencia basado en identificadores geográficos. 

El servicio recibe como entrada un nombre y utiliza este para localizar los 
fenómenos geográficos que cumplen un criterio. Este criterio puede ser variable, 
pudiendo exigir que el nombre coincida plenamente, que comience por él, o que 
lo contenga, entre otras opciones. Es habitual además que el catálogo contenga 
una tipología de los fenómenos recogidos (población, río, puerto, lago, etc.), de 
forma que esta también puede utilizarse para establecer el criterio de consulta 
(por ejemplo, para localizar todos los ríos que comiencen con las letra «b»). 

En el terreno de los nomenclátor encontramos la Norma ISO 19115:2003 
( Geographic Information - Spatial referencing by Geographic Identifiers) , y los 
OGC Catalog Services, que permiten estandarizar procesos de consulta como los 
mencionados. 
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32.7. Estándares para procesamiento 

Además de servir datos, pueden servirse procesos sobre esos datos, de tal forma 
que existan procesos remotos a los que los clientes pueden acceder. También debe 
estandarizarse la forma de acceso a estos servicios y cómo los clientes efectuarán 
las peticiones de procesos y la transmisión o definición de los datos que han de 
tomarse para esos procesos. 


32.7.1. Web Processing Service (WPS) 

El estándar Web Processing Service (WPS) de OGC está enfocado a definir 
el marco en el que se ha de producir el servicio de procesos remotos. WPS define 
una interfaz estándar que facilita la publicación de procesos y su uso posterior por 
parte de clientes. Se entiende por proceso en este contexto a todo aquel algoritmo, 
cálculo o modelo que opere sobre datos georreferenciados. 

Los procesos que pueden definirse son sumamente flexibles, pudiendo tener 
un número cualquiera de entradas y salidas, y operar con distintos tipos de datos. 
Es decir, que ofrece un marco para definir cualquier tipo de proceso de análisis 
geográfico, tanto si este utiliza datos ráster como si utiliza datos vectoriales. Todos 
los procesos que hemos visto en la parte correspondiente al análisis espacial pueden 
ofrecerse como servicios remotos a través de WPS. 

Los datos empleados para alimentar los procesos pueden encontrarse en el 
propio servidor o ser transmitidos a través de la red al igual que la propia petición 
de proceso por parte del cliente. Asimismo, puede relacionarse este estándar con 
otros que ya hemos visto, como por ejemplo WFS. Los datos necesarios para 
ejecutar un proceso que requiera una capa vectorial pueden obtenerse llamando 
a un servicio WFS, en cuyo caso debe indicarse en los parámetros del proceso los 
propios parámetros que corresponden a la petición a ese servicio WFS. 

WPS define tres operaciones básicas, todas ellas obligatorias para todo servidor 
que implemente este estándar: 

■ GetCapabilities. Al igual que en otros estándares que ya hemos visto, esta 
operación hace que el servidor ofrezca los metadatos referentes al servicio. 
En este caso, estos incluyen la definición de todos los procesos que es capaz 
de ejecutar el servidor. 

■ DescribeProcess. El servidor devuelve la definición detallada de uno de los 
procesos soportados, especificando número y tipo de entradas y salidas, y 
formatos válidos para estas. 

■ Execute. Esta operación pide la ejecución de un proceso con unas entradas 
dadas, y la obtención de los resultados de este. 
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32.8. Relación entre estándares 

Los estándares que hemos visto a lo largo de estás páginas guardan una lógica 
relación entre ellos. Dentro de un mismo ámbito, los estándares pueden guardar 
relación con otros similares aun habiendo sido desarrollados por entidades distintas. 
El objetivo de armonización tecnológica que pretenden los estándares resulta más 
difícil de lograr si el número de estándares para una misma tecnología es elevado, 
ya que los fabricantes necesitan dedicar más tiempo y recursos a implementar 
todos ellos, y lo normal es que opten por implementar solo algunos. 

Por este motivo, las organizaciones que promueven estándares trabajan con- 
juntamente y suelen producir estándares muy similares. En algunos casos, como 
ya hemos mencionado, algunos estándares OGC son también estándares ISO, 
existiendo no una similitud sino una absoluta coincidencia. 

Más importante es la relación que guardan entre sí estándares dedicados a áreas 
distintas. Las tecnologías para la gestión y transmisión de datos incluyen diversos 
elementos que forman un todo interrelacionado como vimos en el capítulo 23. Los 
estándares correspondientes a esos elementos y a cada proceso particular que se 
desarrolla deben formar también un todo conectado y poder a su vez «entenderse» 
con otros estándares relacionados. 

Un caso particular de esto es, por ejemplo, el de los estándares WMS, SLD y 
WFS. El servicio WMS ofrece un mapa, que no es sino una representación de unos 
datos según unos criterios dados. Esos datos pueden obtenerse de un servicio WFS 
y los criterios para representarlos pueden expresarse utilizando el estándar SLD. 
La ventaja de los estándares abiertos, máxime si estos han sido además creados 
por una misma organización, es la capacidad de interoperar entre ellos, de forma 
que WMS puede tomar datos de servicios WFS o WCS, o una consulta conforme 
a Filter Encoding puede aplicarse para consultar un servicio WFS y también un 
servicio de nomenclátor. 

Otro ejemplo en esta línea es el que hemos descrito para un servicio WPS que 
toma datos de un servicio WFS para operar con ellos. 

En su conjunto deben verse todos los estándares como una gran familia de 
elementos que armoniza el trabajo con la información geográfica, potenciando así 
el cumplimiento de los objetivos de la IDE. 


32.9. Resumen 

Los estándares abiertos son básicos en el entorno de las IDE para garantizar 
una correcta comunicación entre clientes y servidores, y su adopción implica una 
larga serie de ventajas, aumentando las posibilidades de uso de la IDE y la potencia 
de los datos y herramientas que se incluyen en estas. 

Existen diversas organizaciones que desarrollan estos estándares, siendo OGC 


e ISO las más relevantes en el campo de la información geográfica, y W3C en el 
campo de la World Wide Web. Estás organizaciones han creado estándares que 
son de aplicación en diversas tareas. 

Para la codificación y almacenamiento de la información geográfica encontra- 
mos estándares a nivel conceptual como SFS, y otros para la propia codificación 
y creación de archivos como GML. Este último es el empleado también para la 
transmisión de información geográfica según el estándar WFS, definido para el 
trabajo con datos vectoriales. Para servir coberturas (en la especificación actual 
equivalentes a datos ráster regulares), encontramos el estándar WCS. 

Existen igualmente estándares para mapas, como WMS, que a su vez se apoyan 
en los anteriores para obtener los datos a representar, y en otros como SLD para 
establecer los parámetros de esa representación. 

Los estándares se encuentra interrelacionados entre sí y se apoyan unos en 
otros. El conjunto de todos ellos permite en el seno de una IDE el trabajo fluido 
y la interoperabilidad en todas las operaciones que se realizan. 
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